04 10

Anlisis de datos: un enfoque economtrico
ISBN: 978-84-693-8458-9
Maria Victoria Esteban Gonzlez Marta Reglez Castillo
04-10
Anlisis de datos: un enfoque economtrico a e
Autores: M. Victoria Esteban Gonzalez Marta Reglez Castillo u
Departamento de Econom Aplicada III. Econometr y Estad a a stica Facultad de Ciencias Econmicas y Empresariales o Universidad del Pa Vasco/Euskal Herriko Unibertsitatea s
Presentacin o
El objetivo de este documento es presentar un conjunto de tcnicas economtricas avanzadas para e e la estimacin de modelos lineales en situaciones donde las hiptesis estad o o sticas de comportamiento habituales no se cumplen. Estas notas se estructuran en cinco temas ms un tema introductorio y de a contextualizacin del curso y un tema nal con orientaciones dirigidas al desarrollo por parte de los o alumnos de un proyecto nal donde se muestre la evolucin de un caso prctico de inters. A travs o a e e de los temas se van relajando las hiptesis bsicas sobre la perturbacin aleatoria y sobre la matriz o a o de regresores. El tema introductorio revisa los conceptos de Teor Asinttica que los alumnos ya a o han visto en las asignaturas de Estad stica. Muestra los diferentes conceptos de convergencia y el Teorema de Mann y Wald adiestrando al alumno en su utilidad para derivar las propiedades en muestras grandes y distribucin asinttica de los diferentes estimadores que vern en el curso. o o a El tema uno introduce el concepto de perturbaciones esfricas y muestra las consecuencias en las e propiedades del estimador M nimo Cuadrtico Ordinario de que las perturbaciones no cumplan las a hiptesis bsicas. Asimismo deriva el estimador M o a nimo Cuadrtico Generalizado. Los temas dos a y tres analizan los problemas de heterocedasticidad y autocorrelacin, respectivamente. Muestran o como detectar perturbaciones no esfricas y como contrastar la existencia de heterocedasticidad e y/o autocorrelacin. Aplican el estimador M o nimo Cuadrtico Generalizado en el caso de que sea a necesario y ensean cmo estimar cuando la matriz de varianzas y covarianzas de la perturbacin n o o es desconocida utilizando el estimador de M nimos Cuadrados Generalizados Factibles. En el tema cuatro se relaja la hiptesis bsica sobre la matriz de regresores. Se aborda el escenario en o a que la matriz de datos es estocstica analizando los diferentes estadios de relacin entre los regresores a o estocsticos y la perturbacin aleatoria. Se deriva el estimador de Variables Instrumentales y se a o muestra la utilidad del contraste de Hausman. En el quinto tema se intenta relacionar todos los temas anteriores para lo cual se abordan modelos con dinmica en la parte sistemtica y/o dinmica a a a en la perturbacin. o En cada tema se muestran ejemplos que ilustran los diferentes escenarios de trabajo as como se recomienda la realizacin de ejercicios. Se incluye tambin preguntas evaluativas de los contenidos o e desarrollados. Al trmino de cada tema se muestra la bibliograf correspondiente. Al nal del e a documento aparece la bibliograf completa. a
SARRIKO-ON 04/10
Anlisis de datos a
El Espacio Europeo de Educacin Superior. Los crditos ECTS y los o e distintos tipos de docencia
El diseo de este curso y la organizacin de sus contenidos cumple con los criterios de la declaracin n o o de Bolonia, que tiene como ejes fundamentales el proceso de enseanza-aprendizaje y la adquisicin n o no slo de conocimientos, sino tambin, y fundamentalmente, de destrezas. Esta adaptacin al o e o Espacio Europeo de Educacin Superior (EEES) ha permitido basar la metodolog docente del o a curso en clases magistrales (CM), las clases prcticas de aula (PA), las clases prcticas del Centro a a de Clculo (PO), los seminarios (S) y los talleres (TA). a Cada una de estas clases conlleva una hora de trabajo presencial. Con respecto a las horas no presenciales por cada clase recibida, es decir de tiempo de trabajo no presencial del alumno, las equivalencias son las siguientes: cada clase magistral implica una hora de trabajo no presencial del alumno, mientras que cada clase prctica de aula, prctica de laboratorio informtico, de taller o a a a de seminario implica dos horas de trabajo no presencial del alumno. Este curso conlleva 50 horas de trabajo presencial y 70 horas de trabajo no presencial. Tiene asignados 5 crditos ECTS. En este e curso cada tipo de docencia tiene las siguientes caracter sticas: Clases Magistrales: se utilizan para transmitir conocimientos tericos a grupos numerosos o de alumnos. En estas clases el protagonista es el profesor y en ellas se exponen los contenidos tericos junto a ilustraciones prcticas en pizarra o utilizando el ordenador. o a Prcticas de Aula: en estas clases se aborda el componente prctico de la asignatura. Son a a clases participativas en las que esperamos que el alumno acuda con los ejercicios realizados en tiempo no presencial. Con antelacin se proporciona al alumno los enunciados de los ejercicios o o casos a resolver y en la clase prctica se solucionan las dudas o escollos encontrados por a los alumnos a la hora de resolver el ejercicio. El nmero de alumnos en estas prcticas de u a aula es la mitad que en las clases magistrales. Por ello, es fcil hacer que el alumno participe a resolviendo parte del ejercicio en la misma clase consultando dudas directamente al profesor. Prcticas de Ordenador: son sesiones docentes en las que, en un aula informtica, un grupo a a de alumnos, bajo la direccin de un profesor, realiza una actividad prctica programada que o a requiere el uso del ordenador. Dependiendo de la disponibilidad de ordenadores y de la naturaleza de las prcticas el grupo se encontrar subdividido. El software informtico constituye a a a en este tipo de prctica la herramienta de trabajo fundamental. Las prcticas de ordenador a a permiten al alumno un aanzamiento de los contenidos tericos del curso de Econometr o a como la puesta en prctica de casos reales con la utilizacin del software gretl1 . a o gretl es software libre especialmente dirigido hacia la prctica de la econometr y la estad a a stica, muy fcil de utilizar. Ha sido elaborado por Allin Cottrell (Universidad Wake Forest) y a existen versiones en ingls, castellano y euskera, adems de en otros idiomas. Junto con el e a programa se pueden cargar los datos utilizados como ejemplos de aplicaciones economtricas e en los siguientes libros de texto Davidson y Mackinnon (2004), Greene (2008), Gujarati (1997), Ramanathan (2002), Stock y Watson (2003), Verbeek (2004), Wooldridge (2003). Al instalar
Acrnimo de Gnu Regression, Econometric and Time Series (Biblioteca Gnu de Regresin Econometr y Series o o a Temporales)
1
vi
Anlisis de datos a
SARRIKO-ON 04/10
gretl automticamente se cargan los datos utilizados en Ramanathan (2002) y Greene (2008). a El resto se pueden descargar de la pgina: a http : //gretl.sourcef orge.net/gretl data.html en la opcin textbook datasets. Este curso se estructura sobre casos prcticos presentados en o a Ramanathan (2002) y en Wooldridge (2003) y ejercicios a resolver con ayuda de gretl. Tambin da acceso a bases de datos muy amplias, tanto de organismos pblicos, como el e u Banco de Espaa, como de ejemplos recogidos en textos de Econometr En la pgina n a. a http : //gretl.sourcef orge.net/gretl espanol.html se encuentra la informacin en castellano relativa a la instalacin y manejo del programa. o o Tambin hay versiones de esta ayuda en euskera y en ingls. e e Una pgina web interesante sobre las posibilidades del programa para el aprendizaje de Ecoa nometr es: a http://www.learneconometrics.com/gretl.html Los Talleres (No Industriales): en los talleres los alumnos trabajan en modo cooperativo un caso prctico bajo la tutela del profesor. Con anterioridad al taller se proporciona el a enunciado del caso o situacin a analizar con el n de que de forma individual los alumnos o puedan reexionar sobre la informacin proporcionada y como enfrentar la solucin al proo o blema planteado. En el aula los miembros del grupo tendrn que ayudarse en la direccin de a o solucionar el caso propuesto, argumentando la adecuacin de las decisiones tomadas y siendo o capaces de defenderlas ante el resto del grupo al nal de la sesin. para ello ser necesario que o a cada equipo de alumnos nombre un portavoz que puede ir cambiando a lo largo del curso. Los Seminarios y el Proyecto: el desarrollo de un trabajo o proyecto por parte de un alumno o grupo de alumnos es un tipo de docencia esencial para facilitar la evaluacin continua o del alumno y conocer el rendimiento de autoaprendizaje. Sin ella no hay metodolog docente a orientada a la autoformacin. Algunas de las ms apreciadas habilidades que debe desarrollar o a el alumno: presentar y exponer un trabajo, resumir y realizar un anlisis, trabajar en grupo... a se consiguen precisamente gracias a la presentacin de un proyecto. El proyecto permite el o trabajo en equipo de un reducido grupo de alumnos. Al inicio del curso se jar el tema del a proyecto y se ir desarrollando a lo largo del mismo utilizando para ello los seminarios. a Los seminarios permiten un tipo de docencia que facilita la interaccin uida entre un profesor o y un reducido grupo de alumnos. Se utilizan para que el alumno d cuenta al profesor, en e presencia de los compaeros con los que ha compartido el trabajo, de las tareas prcticas n a que conlleva el desarrollo del proyecto. Algunos seminarios se pueden llevar a cabo en el Centro de Clculo para que los alumnos puedan trabajar y consultar dudas sobre el desarrollo a del proyecto directamente al profesor. Los seminarios nales sern reservados para presentar a trabajos al resto del grupo. Sobre como llevar a cabo este proyecto hablaremos en una de las secciones siguientes. vii
SARRIKO-ON 04/10
Anlisis de datos a
Las competencias espec cas de la asignatura y la evaluacin o

Lo que escucho olvido, lo que veo recuerdo, lo que hago entiendo (Proverbio Chino) Toda la organizacin de la metodolog docente junto con el diseo de los contenidos de los temas o a n del curso van dirigidos a que los alumnos alcancen las siguientes competencias espec cas de la asignatura: 1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e 3. Utilizar diversas fuentes estad sticas y adquirir destreza en el uso de un software economtrico e para analizar relaciones entre variables econmicas. o 4. Elaborar en grupos de trabajo y exponer en pblico, un proyecto emp u rico donde se valore adecuadamente los resultados obtenidos del anlisis de un modelo economtrico. a e El sistema actual de docencia dentro del EEES tiene como ejes fundamentales el proceso de enseanza-aprendizaje y la adquisicin no slo de conocimientos, sino tambin, y fundamentalmente, n o o e de destrezas implica directamente la valoracin del trabajo diario del alumno y su evolucin en la o o adquisicin de las competencias. La utilizacin de la evaluacin continua en la evaluacin de los o o o o alumnos implica la realizacin en clase, en general con componente de sorpresa, es decir sin previo o aviso, de test rpidos o de preguntas cortas en relacin a todo lo visto en las clases, conceptos teria o o cos y ejercicios prcticos tanto de prctica de aula como de prctica de ordenador que permitan a a a evaluar individualmente al alumno y saber si han aprendido los procedimientos adecuados y ver si han alcanzado as las competencias espec cas, en nuestro caso las competencias (1), (2) y (3). La evaluacin del proyecto permitir juzgar la competencia (4). Por ello en estas notas se incluye al o a nal de cada tema ejemplos de preguntas cortas evaluativas de los contenidos de las CM, PA y PO a modo de ejemplo de lo que el alumno podr encontrarse en su propia evaluacin. a o Como se indicaba anteriormente estas notas sirven de apoyo al estudio. Analizan los problemas en profundidad y permiten al alumno profundizar en los temas que conforman el contenido del curso. As mismo tienen una fuerte vertiente prctica que permitir al alumno no solo saber sino tambin a a e saber hacer. En ningn caso deben utilizarse como sustituto de los libros incluidos en la bibliograf u a. De igual manera se recomienda la realizacin de ejercicios tanto los recomendados en clase como los o que aparecen en la bibliograf La unin del estudio de los conceptos y la utilizacin de los mismos a. o o en los ejercicios permite adquirir la agilidad necesaria para el dominio de la asignatura y alcanzar las competencias espec cas de la misma. Las notas tienen como objetivo servir de apoyo al proceso de aprendizaje de los estudiantes de la asignatura Econometr de los Grados en Econom Administracin y Direccin de Empresas, a a, o o Marketing, Fiscalidad y Administracin Pblica, y Finanzas y Seguros as como de las Licenciaturas o u en Econom y Administracin y Direccin de Empresas, ambas en extincin. As mismo sirven de a o o o apoyo a estudiantes de master por ejemplo el Master Universitario en Econom Instrumentos del a: Anlisis econmico o el Mster Universitario en Banca y Finanzas Cuantitativas. a o a viii
Contenido
0. Introduccin y Contextualizacin o o 0.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 0.2. Propiedades de un estimador. Muestras nitas versus muestras grandes . . . . . . . . 0.3. El Modelo de Regresin Lineal General. Estimador M o nimo Cuadrtico Ordinario a (MCO) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.4. Contraste de hiptesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 0.5. Qu vamos a aprender en este curso? . . . . . . . . . . . . . . . . . . . . . . . . . . e 0.6. Ejercicios para practicar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.7. Anexo: Demostracin de la consistencia del estimador MCO . . . . . . . . . . . . . . o 1. M nimos Cuadrados Generalizados 1.1. Modelo de regresin con perturbaciones no esfricas . . . . . . . . . . . . . . . . . . o e 1.2. Propiedades del estimador de MCO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1. Estimador de la matriz de varianzas y covarianzas de M CO . . . . . . . . . 1.3. Mtodo de M e nimos Cuadrados Generalizados (MCG) . . . . . . . . . . . . . . . . . 1.3.1. Propiedades del estimador de MCG . . . . . . . . . . . . . . . . . . . . . . . 1.3.2. Estimador de la matriz de varianzas y covarianzas de M CG . . . . . . . . . 1.4. Mtodo de M e nimos Cuadrados Generalizados Factibles (MCGF) . . . . . . . . . . . 1.4.1. Propiedades del estimador de MCGF . . . . . . . . . . . . . . . . . . . . . . . 1.4.2. Estimador de la matriz de varianzas y covarianzas de M CGF . . . . . . . . 1 1 2 5 12 14 16 19 21 23 26 27 28 29 30 31 32 33 33 36 37 39 40
1.5. Contrastes de restricciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6. Ejemplo: Sistemas de Ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.1. Ecuaciones no relacionadas con varianza comn . . . . . . . . . . . . . . . . . u 1.6.2. Ecuaciones no relacionadas con varianzas distintas . . . . . . . . . . . . . . . 1.6.3. Ecuaciones aparentemente no relacionadas . . . . . . . . . . . . . . . . . . . . ix
SARRIKO-ON 04/10
Anlisis de datos a 41 43 45 47 52 52 57 61 65 67 69 72 73 80 87 90 94 98 99
1.7. Ejercicios a resolver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.8. Bibliograf del tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a 2. Heterocedasticidad 2.1. Concepto de heterocedasticidad. Naturaleza y consecuencias. Ejemplos . . . . . . . . 2.2. Contrastes de heterocedasticidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1. Deteccin grca. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o a 2.2.2. Test de contraste para heterocedasticidad . . . . . . . . . . . . . . . . . . . . 2.3. El estimador MCG bajo heterocedasticidad. M nimos Cuadrados Ponderados . . . . 2.4. Estimador de M nimos Cuadrados Generalizados Factibles. Especicacin de un moo delo para la heterocedasticidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5. MCO: Estimador de V (M CO) robusto a heterocedasticidad . . . . . . . . . . . .
2.6. Contraste de restricciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7. Resumen de los resultados obtenidos en el ejercicio magistral . . . . . . . . . . . . . 2.8. Ejercicios a resolver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9. Prcticas de Aula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a 2.10. Prcticas de Ordenador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a 2.11. Taller sobre todo lo trabajado en el tema . . . . . . . . . . . . . . . . . . . . . . . . 2.12. Evaluativas - Preguntas Cortas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.13. Bibliograf del tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a 2.14. Anexo 1.1: Resultados de gretl utilizados en las clases magistrales . . . . . . . . . . .
2.15. Anexo 1.2: Instrucciones bsicas de gretl para heterocedasticidad . . . . . . . . . . . 103 a 3. Autocorrelacin o 111
3.1. El concepto de autocorrelacin y su modelizacin . . . . . . . . . . . . . . . . . . . . 113 o o 3.1.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 o 3.1.2. Procesos Autorregresivos y de Medias Mviles o . . . . . . . . . . . . . . . . . 114
3.2. Contrastes de autocorrelacin y anlisis de residuos . . . . . . . . . . . . . . . . . . . 119 o a 3.2.1. Contraste de Durbin y Watson . . . . . . . . . . . . . . . . . . . . . . . . . . 119 3.2.2. Contraste de Breusch y Godfrey . . . . . . . . . . . . . . . . . . . . . . . . . 121 3.2.3. Anlisis de los residuos y contrastes: ejemplos . . . . . . . . . . . . . . . . . . 122 a 3.3. Consecuencias de la deteccin de autocorrelacin . . . . . . . . . . . . . . . . . . . . 139 o o 3.4. Estimacin por MCGF bajo un AR(1) . . . . . . . . . . . . . . . . . . . . . . . . . . 140 o x
Anlisis de datos a
SARRIKO-ON 04/10
3.4.1. Mtodo de Hildreth y Lu: Red de bsqueda . . . . . . . . . . . . . . . . . . . 141 e u 3.4.2. Mtodo de Cochrane-Orcutt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 e 3.5. Inferencia utilizando el estimador MCO con autocorrelacin . . . . . . . . . . . . . . 145 o 3.6. Inferencia con MCGF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 3.7. Ejercicios a resolver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 3.8. Prcticas de Aula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 a 3.9. Prcticas de Ordenador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 a 3.10. Taller sobre todo lo trabajado en el tema . . . . . . . . . . . . . . . . . . . . . . . . 156 3.11. Evaluativas - Preguntas cortas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 3.12. Bibliograf del tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 a 3.13. Anexo: Instrucciones bsicas de gretl para autocorrelacin . . . . . . . . . . . . . . . 165 a o 4. Regresores Estocsticos a 169
4.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 o 4.2. Propiedades del estimador MCO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 4.2.1. Independencia entre regresor y error . . . . . . . . . . . . . . . . . . . . . . . 173 4.2.2. Incorrelacin contempornea entre regresores y error . . . . . . . . . . . . . . 176 o a 4.2.3. Correlacin entre regresores y error . . . . . . . . . . . . . . . . . . . . . . . . 177 o 4.3. Estimador de Variables Instrumentales . . . . . . . . . . . . . . . . . . . . . . . . . . 180 4.3.1. Propiedades del estimador de Variables Instrumentales . . . . . . . . . . . . . 181 4.3.2. Cmo buscar los instrumentos o . . . . . . . . . . . . . . . . . . . . . . . . . . 183
4.3.3. Contraste de hiptesis con el estimador de VI . . . . . . . . . . . . . . . . . . 191 o 4.4. Contraste de Hausman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 4.5. Ejercicios a resolver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 4.6. Prcticas de Aula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 a 4.7. Prcticas de Ordenador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 a 4.8. Evaluativas - Preguntas cortas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 4.9. Bibliograf del tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 a 4.10. Anexo 4.1: Instrucciones bsicas de gretl para regresores estocsticos . . . . . . . . . 216 a a 4.11. Anexo 4.2. Errores de medida en las variables . . . . . . . . . . . . . . . . . . . . . . 217 4.11.1. Variable endgena medida con error . . . . . . . . . . . . . . . . . . . . . . . 217 o 4.11.2. Variable exgena y variable endgena medidas con error . . . . . . . . . . . . 218 o o xi
SARRIKO-ON 04/10
Anlisis de datos a
4.12. Anexo 4.3. Estimador de Variables Instrumentales . . . . . . . . . . . . . . . . . . . 219 4.13. Anexo 4.4. Estimador de M nimos Cuadrados en dos etapas . . . . . . . . . . . . . . 220 5. Modelos Dinmicos a 223
5.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 o 5.2. Especicacin y estimacin de modelos dinmicos . . . . . . . . . . . . . . . . . . . . 225 o o a 5.2.1. Dinmica solamente en la parte sistemtica . . . . . . . . . . . . . . . . . . . 225 a a 5.2.2. Dinmica en la parte sistemtica y en la perturbacin . . . . . . . . . . . . . 227 a a o 5.3. Ejemplo magistral: hacia una modelizacin dinmica . . . . . . . . . . . . . . . . . . 230 o a 5.4. Ejercicios a resolver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 5.5. Prcticas de Aula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 a 5.6. Prcticas de Ordenador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252 a 5.7. Taller sobre todo lo trabajado en el tema . . . . . . . . . . . . . . . . . . . . . . . . 254 5.8. Evaluativas - Preguntas cortas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 5.9. Bibliograf del tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 a 5.10. Anexo: Instrucciones bsicas de gretl para modelos dinmicos . . . . . . . . . . . . . 263 a a 6. Gu para el desarrollo de un proyecto emp a rico 265
6.1. Caracter sticas bsicas del proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265 a Bibliograf a Apndice e 269 271
xii
Figuras
2.1. Perturbaciones homocedsticas versus heterocedsticas . . . . . . . . . . . . . . . . . a a 2.2. Residuos MCO versus P OP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Residuos MCO versus P OP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Residuos MCO y sus cuadrados versus SEN . . . . . . . . . . . . . . . . . . . . . . . 2.5. Perturbaciones homocedsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a 2.6. Residuos MCO frente a una variable cticia . . . . . . . . . . . . . . . . . . . . . . 48 53 53 54 54 55 56 57 75 77 78 79 82 84 96
2.7. Consumo versus Renta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8. Residuos MCO versus Renta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.9. CSSi versus residuos MCO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.10. Variables y Residuos MCO del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 2.11. Variables y residuos MCO del modelo transformado . . . . . . . . . . . . . . . . . . . 2.12. Residuos MCO frente a Renta Agregada . . . . . . . . . . . . . . . . . . . . . . . . . 2.13. Grco de residuos MCO sobre las observaciones i = 1, . . . , 224 y sobre la variable sqft . . . a 2.14. Grco de residuos MCO sobre la variable Income y sobre la variable age . . . . . . . . . . a 2.15. Residuos MCO versus variables independientes . . . . . . . . . . . . . . . . . . . . . 3.1. Ruido blanco = 0
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.2. Proceso AR(1) con = 0, 95 3.3. Proceso AR(1) con = 0, 95
3.4. Proceso MA(1) con = 0, 95 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 3.5. Proceso MA(1) con = 0, 95 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 3.6. Grco de la serie de Inversin observada y estimada . . . . . . . . . . . . . . . . . . . . 123 a o 3.7. Grco de la serie temporal de los residuos MCO . . . . . . . . . . . . . . . . . . . . . . 124 a 3.8. Grco de la serie de Inversin observada y estimada . . . . . . . . . . . . . . . . . . . . 125 a o 3.9. Grco de la serie temporal de los residuos MCO . . . . . . . . . . . . . . . . . . . . . . 125 a xiii
SARRIKO-ON 04/10
Anlisis de datos a
3.10. Grco de la serie observada y ajustada con especicacin lineal . . . . . . . . . . . 127 a o 3.11. Grco de residuos MCO de la especicacin lineal . . . . . . . . . . . . . . . . . . . 127 a o 3.12. Grco de la serie observada y ajustada con especicacin cuadrtica a o a . . . . . . . . 128
3.13. Grco de residuos MCO de la especicacin cuadrtica . . . . . . . . . . . . . . . . 129 a o a 3.14. Grco de la serie observada y ajustada con el Modelo (3.7) . . . . . . . . . . . . . . 130 a 3.15. Grco de residuos MCO del Modelo (3.7) . . . . . . . . . . . . . . . . . . . . . . . . 130 a 3.16. Grco de la serie observada y ajustada con el Modelo (3.8) . . . . . . . . . . . . . . 131 a 3.17. Grco de residuos MCO del Modelo (3.8) . . . . . . . . . . . . . . . . . . . . . . . . 132 a 3.18. Evolucin temporal de las variables INVERR y TIREAL . . . . . . . . . . . . . . . . 133 o 3.19. Serie INVERR observada y ajustada: Modelo sin PNBR . . . . . . . . . . . . . . . . 134 3.20. Serie de residuos MCO: Modelo sin PNBR . . . . . . . . . . . . . . . . . . . . . . . 134
3.21. Serie INVERR observada y ajustada: Modelo con PNBR . . . . . . . . . . . . . . . . 137 3.22. Serie de residuos MCO: Modelo con PNBR . . . . . . . . . . . . . . . . . . . . . . . 137 3.23. Funcin de Suma de Cuadrados Residual del modelo transformado . . . . . . . . . . 142 o 4.1. Serie sin tendencia versus serie con tendencia . . . . . . . . . . . . . . . . . . . . . 186
5.1. Grcos de las series de fertilidad y de las exenciones scales . . . . . . . . . . . . . 231 a 5.2. Grco de residuos MCO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 a 5.3. Grco de la serie gfr observada y ajustada . . . . . . . . . . . . . . . . . . . . . . . 232 a 5.4. Grco de residuos MCO y de la serie gfr observada y ajustada . . . . . . . . . . . . 234 a 5.5. Grcos de residuos y de la serie gfr observada y ajustada . . . . . . . . . . . . . . . 236 a 5.6. Grco de residuos MCO y de la serie gfr observada y ajustada . . . . . . . . . . . . 238 a 5.7. Grco de residuos y de la serie gfr observada y ajustada . . . . . . . . . . . . . . . 249 a 5.8. Grco de residuos y de la serie INVENTARIOS observada y ajustada . . . . . . . . 256 a
xiv
Tablas
6.1. Modelos estimados para el precio de la vivienda P RICE . . . . . . . . . . . . . . . 268
6.2. Funcin de Salarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 o A.3. Observaciones de Consumo y Renta . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 A.4. Datos de la empresa Lydia Pinkham (1907-1960) . . . . . . . . . . . . . . . . . . . . 272
xv
Tema 0
Introduccin y Contextualizacin o o
0.1. Introduccin o
La asignatura de Econometr avanza en el estudio de la materia profundizando en tpicos como: a o la relajacin de las hiptesis bsicas sobre la perturbacin, los regresores estocsticos y los modelos o o a o a dinmicos. Todos ellos conceptos con dicultad relativa. Es por ello, que merece la pena dedicar un a tiempo a contextualizar los conceptos que van a estudiarse en esta asignatura recordando algunos vistos en clases de estad stica o en econometr no tan avanzada en relacin a la estimacin e a o o inferencia del modelo de regresin lineal. Este tema introductorio pretende situarnos en los nuevos o marcos a trabajar en el resto del curso. Le dedicaremos tres clases magistrales en las que recordamos los conceptos tericos y los ilustraremos con ejemplos para su mejor comprensin. Al nal del tema o o se proponen algunos ejercicios que ser interesante resolver para jar los conceptos. a La inferencia estad stica es el rea que trata sobre los procedimientos que permiten utilizar la ina formacin contenida en los datos muestrales de forma ecaz, para obtener informacin sobre la o o poblacin de la que provienen o sobre el proceso que los ha generado. Supongamos que existe un o proceso desconocido que ha generado los datos muestrales descrito mediante una funcin de distrio bucin que se caracteriza por un conjunto de parmetros. Sea una muestra de T variables aleatorias o a Z = (Z1 , Z2 , . . . , ZT ), cuya funcin de densidad conjunta f (Z; ) depende de un vector de parmeo a tros = (1 , 2 , . . . , k ) . Es habitual suponer que tanto la forma matemtica de la funcin a o de densidad f como el espacio de parmetros son conocidos, por lo que queda perfectamente a determinado el modelo estad stico generador de las variables aleatorias Z. La inferencia estad stica consiste en usar los datos muestrales de Z para inferir el valor del vector de parmetros . Para ello a utilizaremos un estimador o regla. Un estimador por punto es un estad stico calculado a partir de la muestra que nos proporciona un unico valor para cada parmetro desconocido del vector de parmetros. Un estimador por a a intervalo proporciona un rango de valores que contiene el verdadero parmetro con una probaa bilidad determinada. Un estimador es una variable aleatoria ya que es una funcin de variables o aleatorias. Sustituidos los valores muestrales en el estad stico obtenemos una estimacin, o valor o en la muestra del estimador. Es importante distinguir entre estimador, una funcin luego variable o aleatoria y estimacin, un nmero o realizacin en la muestra del estimador. o u o 1
SARRIKO-ON 04/10
Anlisis de datos a
0.2.
Propiedades de un estimador. Muestras nitas versus muestras grandes
Estimadores de los parmetros desconocidos contenidos en podemos encontrar muchos, pero solo a algunos sern estimadores adecuados por lo que necesitaremos criterios de comparacin entre ellos. a o En general compararemos estimadores a partir de una variedad de atributos. Las propiedades en muestras nitas de los estimadores son aquellos atributos que pueden ser comparados independientemente del tamao de muestra y por tanto se cumplen independientemente de ste. En n e ocasiones algunas caracter sticas de los estimadores no sern conocidas para muestras de tamao a n nito, en esta situacin compararemos los estimadores mediante sus propiedades asintticas, es o o decir cuando el tamao de muestra crece y tiende a innito. n Qu estimadores nos interesan? En principio querremos estimadores que con alta probabilidad e proporcionen estimaciones que estn cerca del verdadero valor del parmetro. Las propiedades en e a muestras nitas que en general se desean en un estimador son: que sea insesgado, es decir que en media coincida con el verdadero valor del parmetro y que tenga varianza m a nima. Insesgadez: Se dice que un estimador es insesgado si E() = . Eciencia: Un estimador es eciente dentro de la clase de estimadores insesgados si su varianza es la menor entre todas las varianzas de los estimadores insesgados. Al reconocer la eciencia como una propiedad deseable en un estimador estamos dejando excluidos a estimadores sesgados incluso cuando su varianza sea muy pequea y en ocasiones podr n amos tolerar un cierto sesgo a cambio de una varianza reducida. Un criterio que nos permite tener en cuenta estas situaciones de un sesgo tolerable unido a varianza pequea es el criterio del Error Cuadrtico n a Medio (ECM). El ECM de un estimador se dene: ECM () = E( )2 = V () + [Sesgo()]2 y elegimos el estimador que lo minimice. Utilizando el ECM vemos que entre dos estimadores insesgados preferimos aquel con menor varianza. Sin embargo, no es cierto que entre un estimador insesgado y otro sesgado tenga que ser mejor el insesgado. El sesgado puede tener menor ECM y ser el preferido si el criterio elegido es el de minimizar el ECM. El ECM permite comparar entre s estimadores insesgados, sesgados o sesgados con insesgados. La distribucin de un estimador puede cambiar con el tamao muestral. En ocasiones no es posible o n obtener cuantitativamente el valor medio de un estimador para saber si es insesgado o no. Lo mismo puede ocurrir con su varianza para un tamao de muestra dado. En estas situaciones determinar las n propiedades anal ticas del estimador en muestras nitas es muy complicado y se pasa a estudiar las propiedades asintticas. El conocimiento del comportamiento en el l o mite de la distribucin de o un estimador, puede utilizarse para inferir una distribucin aproximada para el estimador obtenido o en una muestra nita. Para ello necesitaremos conceptos de teor asinttica. a o 2
Anlisis de datos a
SARRIKO-ON 04/10
La teor asinttica analiza el comportamiento aproximado de un estimador o estad a o stico cuando T . Por qu analizamos esto? Es deseable poder obtener estimadores y estad e sticos y conozcamos sus propiedades tal que para muestras nitas: insesgadez, eciencia y sus distribuciones; pero en muchas ocasiones estas propiedades se conocen a costa de tener que hacer supuestos muy particulares y restrictivos que pueden no satisfacerse y/o ser dif ciles de contrastar. Otras veces no es posible encontrar estimadores que tengan propiedades deseables para muestras nitas, las que se satisfacen para un tamao muestral dado, pero que tienen propiedades deseables en muestras n grandes, es decir cuando T , cuando el tamao muestral es sucientemente grande. A estas n propiedades las llamaremos propiedades asintticas o propiedades en muestras grandes. o Algunas propiedades asintticas deseables en un estimador son la consistencia y la eciencia asinttio o ca. A continuacin deniremos una serie de conceptos y propiedades deseables en un estimador o que sern vlidos asintticamente, es decir, cuando el tamao muestral sea sucientemente grande a a o n (T ). Consistencia: Se dice que un estimador T es un estimador consistente del parmetro desa conocido , funcin de una muestra de tamao T , es consistente si a medida que el tamao o n n muestral T aumenta, la sucesin {T } = {1 , 2 , . . .} converge en probabilidad al verdadero o valor del parmetro . Esto es, a >0 y lo denotamos. p T como o plimT =
T
lim P r{|T | < } = 1
Estas condiciones se corresponden con la Proposicin 2.2 Novales, pp.38. o La consistencia es una propiedad asinttica deseable en un estimador ya que analizamos si la sucesin o o de estimadores {T } converge en probabilidad al verdadero valor del parmetro. Intuitivamente: a Supongamos que es un estimador del parmetro , variable aleatoria que es funcin de la muestra a o de un tamao T. Si consideramos la sucesin de variables aleatorias: n o 1 estimador funcin de la muestra tamao T1 o n 2 estimador funcin de la muestra tamao T2 , T2 > T1 o n . . . N estimador funcin de la muestra tamao TN , TN > TN 1 o n y as sucesivamente a medida que consideramos muestras de mayor tamao (T ) obtendr n amos T }. Si la sucesin {T } converge en probabilidad al verdadero una sucesin de variables aleatorias { o o valor (desconocido) del parmetro se dice que el estimador es un estimador consistente. a Insesgadez Asinttica: Diremos que el estimador de es un estimador insesgado asinttio o camente si lim E(T ) =
T
SARRIKO-ON 04/10
Anlisis de datos a
Es importante notar que consistencia no implica insesgadez asinttica ni viceversa, un estimador o consistente no tiene porqu ser insesgado asintticamente. De igual forma un estimador insesgado e o asintticamente no tiene porque ser consistente. Sin embargo, si un estimador es insesgado asinttio o camente y adems su varianza en el l a mite es cero el estimador es consistente. La unin de estas o dos condiciones, insesgadez asinttica y varianza asinttica que tienda a cero cuando el tamao de o o n muestra tiende a innito conforman las condiciones sucientes, aunque no necesarias, de consistencia: Condiciones sucientes de consistencia: Sea {E(T )} una sucesin del momento de prio mer orden de T cuando el tamao muestral T aumenta hasta innito. Sea {V ar(T )} una n T cuando el tamao muestral T aumenta sucesin del momento centrado de orden dos de o n hasta innito. Entonces si: (1) lim E(T ) = T p T ) = 0 T = plimT = (2) lim V ar(
T
Estas condiciones se corresponden con la Proposicin 2.9 Novales pp.38. o En ocasiones demostrar la consistencia de un estimador mediante la denicin formal es complicado o y resulta ms sencillo utilizar las condiciones sucientes de consistencia. Es importante notar que a para que un estimador sea consistente no necesitamos conocer los momentos de T , es decir E(T ) 2 ), E[2 E(T )] etc . . . ni necesitamos que existan para cada tamao muestral. Sin o E(T o n T embargo, si decidimos probar la consistencia de un estimador mediante las condiciones sucientes de consistencia si necesitamos conocer E(T ) y V ar(T ). Eciencia Asinttica dentro de una clase: Si nos limitamos a la clase de estimadores o consistentes y asintticamente normales, diremos que un estimador de esa clase es eciente o asintticamente, si y slo si su varianza asinttica es la menor de todas las varianzas asintticas o o o o de los estimadores de esa clase. Distribucin Asinttica: La distribucin asinttica es una distribucin que se utiliza para aproo o o o o ximar la verdadera distribucin muestral de una variable aleatoria, que puede ser perfectamente un o estimador. Cuando es dif o imposible derivar la distribucin muestral de un estimador o estad cil o stico estudiaremos su distribucin de probabilidad cuando la muestra tiende a innito. Si a medida o que el tamao de muestra aumenta la distribucin del estimador se aproxima a una distribucin n o o espec ca conocida, para tamaos de muestra grandes podemos usar esta distribucin como una n o aproximacin a la verdadera distribucin del estimador. Esta es la idea que transmite la siguiente o o denicin de convergencia: o Convergencia en Distribucin: Sea Z1 , Z2 , Z3 . . . , ZT una sucesin de variables aleatorias o o denidas conjuntamente con sus respectivas funciones de distribucin F1 (Z1 ), F2 (Z2 ), F3 (Z3 ) o . . . , FT (ZT ). Supongamos FT (z) F (z) en todos los puntos de continuidad de la funcin F (z) y que o en ellos, F (z) es una funcin de distribucin. Entonces se dice que la sucesin de variables o o o 4
Anlisis de datos a
SARRIKO-ON 04/10
aleatorias ZT converge en distribucin a Z, donde Z es una variable aleatoria con funcin de o o d a distribucin F , y se representa por ZT Z (o tambin como ZT F (z)). La distribucin o e o F (z) se conoce como Distribucin Asinttica o Distribucin L o o o mite. Estas condiciones se corresponden con la Denicin 2.3 Novales pp.40. o A continuacin se van a enunciar dos teoremas de gran utilidad para demostrar las propiedades o asintticas de un estimador: El Teorema de Mann y el teorema de Cramer. Ambos teoremas sern o a de utilidada en el marco del MRLG para derivar propiedades asintticas de ciertos estimadores, en o particular consistencia y distribucin asinttica. o o Teorema de Mann y Wald: Sean X una matriz de orden T K y u un vector de dimensin o T 1 tales que: i) E(u) = 0,
2 E(uu ) = u IT
ii) E(Xi u) = 0 i = 1, 2, . . . , K, donde Xi es la columna i-sima de la matriz X. e ( E(X u) = 0) iii) plim XTX = Q matriz nita, simtrica y denida positiva. e
Si i), ii) y iii) se verican, entonces tenemos dos resultados: a) plim X u = 0 T d X u N 0, 2 Q b) u T Este teorema aparece en Novales pp. 43.
Teorema de Cramer: Sea YT una matriz aleatoria de dimensin ja p q y sea XT un o vector aleatorio de dimensin q 1. Entonces, si: o (1) YT A (matriz de constantes) (2) XT X
d p
se tiene que YT XT AX
Este teorema se corresponde con la Proposicin 2.16 Novales pp. 41. o
0.3.
El Modelo de Regresin Lineal General. Estimador M o nimo Cuadrtico Ordinario (MCO) a
Escribimos el Modelo de Regresin Lineal General: o Yt = 1 X1t + 2 X2t + . . . + K XKt + ut t = 1, 2, . . . , T Yt = Xt + ut (1)
donde explicamos el comportamiento de la variable endgena Y con un conjunto de K variables o exgenas o independientes, X1t , X2t , X3t , . . . , XKT donde X1t = 1 t, con lo que el modelo tiene o 5
SARRIKO-ON 04/10
Anlisis de datos a
trmino constante. La variable aleatoria u se denomina perturbacin o error y no es observable. Ree o coge todo aquello del comportamiento de la variable endgena que no es recogido por las variables o exgenas. Los coecientes 1 , 2 , . . . , K son los parmetros desconocidos de la relacin y son los que o a o queremos determinar. Para obtener valores factibles del promedio de Y a partir de una muestra de tamao T , t = 1, . . . , T podemos utilizar una estimacin por punto o una estimacin por intervalo. n o o Un estimador del vector de parmetros = (1 , 2 , . . . , K ) es una funcin de la muestra luego es a o una variable aleatoria. En general se supone que se cumplen las siguientes hiptesis: o Sobre los regresores: (1) Suponemos que X es una matriz de regresores que no son realizaciones de variables aleatorias (en adelante v.a.), es decir, son regresores no estocsticos. Este supuesto se a puede entender como un anlisis condicionado a unos valores dados de las variables a explicativas1 . Adems, sobre los regresores suponemos tambin que la matriz X es de a e rango completo por columnas, rg(X) = K. Sobre las perturbaciones u, se las supone: (2) media cero, E(ut ) = 0 t, (3) varianza constante E(u2 ) = 2 t (4) covarianzas cero, E(ut us ) = 0 t, es decir, son homocedsticas a t, s t = s luego son no autocorreladas.
(5) adems se supone que siguen una distribucin normal, ut N (0, 2 ). a o Sobre los parmetros se supone que son constantes durante todo el periodo muestral. a Sobre la relacin se la supone lineal en parmetros, o linealizable, adems de correctamente o a a especicada. Las K-ecuaciones recogidas en (1) dan lugar a la siguiente expresin matricial del MRLG: o Y1 Y2 Y3 . . . YT Y
(T 1)
1 X21 1 X22 1 X23 . . . . . . 1 X2T
X31 X32 X33 . . . X3T
. . . XK1 . . . XK2 . . . XK3 . .. . . . . . . XKT X
1 2 3 . . . K
u1 u2 u3 . . . uT
u
(T 1 )
(T K)
(K 1)
En ocasiones este tipo de anlisis no ser posible y tendremos que considerar que X es una matriz estocstica. a a a
Anlisis de datos a
SARRIKO-ON 04/10
Las hiptesis establecidas sobre la perturbacin nos denen el vector de medias y la matriz de o o varianzas y covarianzas siguientes: E(u) = E(uu ) = 2 = 2 IT
0 0 0 . . . 0
1 0 0 0 1 0 0 0 1 . . . .. . . . . . . . 0 0 0
0 0 0 . . . 1
Matricialmente escribimos el modelo junto con los supuestos sobre la perturbacin: o Y = X + u u N (0, 2 IT )
Para lograr nuestro objetivo de estimar los coecientes 1 , . . . , K desconocidos proponemos utilizar el criterio de estimacin M o nimo Cuadrtico Ordinario, MCO, donde se minimiza la Suma de a Cuadrados Residual del modelo. Matricialmente el criterio se escribe: M in u u = M in (Y X ) (Y X ) Las ecuaciones normales que se obtienen de las condiciones de primer orden son: (X X) = X Y a partir las cuales derivamos el estimador de los parmetros : a M CO = (X X)1 (X Y ) Adems, en general, la varianza de la perturbacin ser desconocida. Como estimador de 2 propoa o a nemos: uu M CO = 2 T k Bajo las hiptesis establecidas el estimador MCO del vector de parmetros desconocidos es un o a estimador lineal en la perturbacin, insesgado y de varianza m o nima en muestras nitas. En muestras grandes o asintticas es consistente. El estimador propuesto para 2 , 2 es insesgado y consistente. o
Ejemplo 0.1
En el Modelo de Regresin Lineal General: o Y = X + u
donde X es no estocstica y u N IID(0, 2 IT ) se van a obtener las propiedades y distribucin en a o muestras nitas del estimador MCO del vector de coecientes .
SARRIKO-ON 04/10 Propiedades en muestras nitas:
Anlisis de datos a
1. Linealidad: Dado que X es no estocstica el estimador MCO es lineal en u, ya que se puede a escribir como una combinacin lineal del vector de perturbaciones u y la matriz de constantes o D = (X X)1 X , siendo u lo unico aleatorio de su expresin: o M CO = + (X X)1 X u = + D u Para demostrar esta propiedad hemos utilizado la hiptesis recogida en (1). o 2. Insesgadez: E(M CO ) = E((X X)1 X Y ) = E[ + (X X)1 X u] = + E[(X X)1 X u] = + (X X)1 X E(u) = E(M CO ) = , luego el estimador es insesgado. Para demostrar esta propiedad hemos utilizado las hiptesis recogidas en (1) y (2). o 3. Matriz de varianzas y covarianzas: V (M CO ) = E[(M CO E(M CO ))(M CO E(M CO )) ] = 1 X (uu )X(X X)1 ) = E((X X) = (X X)1 X E(uu )X(X X)1 = 2 (X X)1 Para obtener esta matriz de varianzas y covarianzas del estimador MCO hemos utilizado las hiptesis recogidas en (1), (2) y (3). o El Teorema de Gauss-Markov garantiza que el estimador de MCO tiene la menor varianza entre todos los estimadores lineales e insesgados, luego es eciente. Distribucin en muestras nitas o distribucin exacta: Dado que el estimador MCO es lineal en o o la perturbacin sigue la misma distribucin que sta. Como la distribucin de u es normal la o o e o distribucin del estimador MCO es normal. Su distribucin exacta o en muestras nitas es: o o M CO N (, 2 (X X)1 )
Ejercicio 0.1
donde X es no estocstica y u IID(0, 2 IT ). Obtn las propiedades del estimador MCO del a e vector de coecientes . Es conocida su distribucin en muestras nitas? Puedes hacer contraste o de hiptesis en muestras nitas? o
Anlisis de datos a Ejemplo 0.2 En el Modelo de Regresin Lineal General: o Y = X + u
SARRIKO-ON 04/10
donde X es no estocstica y u N ID(0, 2 IT ) vamos a demostrar la consistencia del estimador a MCO del vector de coecientes y a obtener su distribucin asinttica. o o Dado que se cumplen las condiciones i), ii) del teorema de Mann y Wald y que suponemos que iii) tambin se cumple, vamos a utilizar este teorema para demostrar la consistencia del estimador2 . A e continuacin derivamos su distribucin asinttica. o o o Consistencia: Mann y Wald proporciona el resultado a) util para demostrar la consistencia del estimador: Xu resultado a) plim =0 T luego 1 1 1 M CO = + (X X)1 X u = + XX Xu T T plim M CO = plim + plim luego el estimador es consistente. Distribucin Asinttica: Dado que el estimador es consistente o o
p p M CO (M CO ) 0
1 XX T
plim
1 Xu T
= + Q1 0 =
luego la distribucin del estimador en el l o mite es degenerada, es decir, tiene toda la masa probabil stica acumulada en un punto, , su media, mientras que su varianza asinttica es cero. Por ello o no vamos a buscar la distribucin en el l o mite de M CO si no de transformacin del mismo que una o M CO ). Vamos a comenzar no tiene distribucin l o mite degenerada. Esta transformacin es T ( o desarrollando esta expresin: o M CO = + (X X)1 X u M CO = (X X)1 X u 1 1 1 X u T (M CO ) = T X X T
y para ella obtenemos la distribucin asinttica ayudndonos del resultado b) de Mann y Wald y o o a del Teorema de Cramer. resultado b) 1 Xu T N (0, 2 Q)
d
Por Cramer, 1) Tenemos una variable aleatoria Z que converge en distribucin, Z = o 2) Tenemos la matriz Q que converge en probabilidad, luego
1 TX
X Q.
1 X T p
u N (0, 2 Q).
2 En el Anexo del tema se muestra cmo demostrar la consistencia del estimador MCO utilizando la denicin de o o consistencia y sin recurrir al uso del Teorema de Mann y Wald.
SARRIKO-ON 04/10
Anlisis de datos a
Usando 1) y 2) donde Z N (0, 2 Q), obtenemos Q1 Z N (0, 2 Q1 ) luego podemos demostrar tambin que3 : e
Z=
1 XX T 1 XX T
1 Xu T 1 Xu T
Q1 Z N (0, 2 Q1 )
d
d T (M CO ) N (0, 2 Q1 ) Notar que a pesar de que por el enunciado del ejercicio se conoce que la perturbacin es normal a lo o largo de la demostracin no se ha utilizado este conocimiento. Luego si desconocemos la distribucin o o de u el resultado de consistencia y la distribucin asinttica permanecen invariantes. Este resultado o o nos va a permitir hacer inferencia sobre basndonos en esta distribucin asinttica de T (M CO a o o ) cuando no conozcamos la distribucin exacta para un tamao de muestra dado (del que nosotros o n dispondremos) y que ser una aproximacin mejor cuanto mayor sea el tamao muestral. a o n a Ejemplo 0.3 Sea el modelo Y = X + u donde X es una matriz de variables no estocsticas, 1 2 I) y u (0, e lim = T X X = Q nita, simtrica y denida positiva. Denimos el estimador:
T
1 = M CO + c T donde c = (c1 , c2 , . . . , cK ) es un vector de constantes no aleatorias, nito, que no depende de T. 1. Obtn la esperanza matemtica de y su matriz de varianzas y covarianzas. Cules son las e a a propiedades en muestras nitas del estimador ? 2. Deriva el sesgo del estimador . Cmo es el sesgo cuando aumenta T? o 3. Son los estimadores M CO y consistentes? 4. Busca la distribucin asinttica del estimador . o o Solucin: o 1.
1 1 E() = E(M CO + T c) = + T c 2 = E[ ( + 1 c)]2 = E[ M CO + V () = E[ E()] T M CO )2 = 2 (X X)1 = E(
3
1 T
1 T
c]2
E(Q1 Z) V (Q1 Z)
= Q1 E(Z) = 0. = E((Q1 Z)(Q1 Z) ) = Q1 E(ZZ )Q1 = Q1 ( 2 Q)Q1 = 2 Q1 QQ1 = 2 Q1 .
10
Anlisis de datos a
SARRIKO-ON 04/10
Luego si u (0, 2 IT ) el estimador es un estimador lineal en u, es sesgado y su matriz de varianzas y covarianzas coincide con la del estimador de MCO. 2. Sesgo() = E() = +
1 T
c =
1 T
c. Si T entonces el sesgo se hace nulo:

1 T T lim 1 T T
lim
1 c= . lim . T T .
lim 1 T T
c2 = ck c1
0 0 . . . 0
Adems ECM () = 2 (X X)1 + a
1 T
> 2 (X X)1 = ECM (M CO ).
3. Como se ha probado en el Ejemplo 0.3 el estimador M CO es consistente. A continuacin vamos o es consistente utilizando las condiciones sucientes de consistencia: a probar que el estimador (1) lim E() = (2) lim V () =
T T 1 T T
T T
lim + lim
c=+0=
lim V (M CO ) = 0
p plim =
Luego el estimador es consistente. p p Adems en el l a mite ambos estimadores coinciden M CO . 4. Distribucin asinttica: o o En primer lugar vamos a buscar la expresin para T ( ) o 1 T ( ) = T (M CO + T c ) = 1 = T (M CO ) + T T c = 1 = T (M CO ) + T c A continuacin buscamos la distribucin asinttica de o o o d T (M CO ) N (0, 2 Q1 ) y 1 c 0 T T (M CO ) +
1 T
c. Dado que:
d T ( ) N (0, 2 Q1 )
Ejercicio 0.2
donde X es no estocstica y u IID(0, 2 IT ). Demuestra la consistencia del estimador MCO a utilizando las condiciones sucientes de consistencia. 11
SARRIKO-ON 04/10
Anlisis de datos a
0.4.
Contraste de hiptesis o
Si conocemos la distribucin de la perturbacin y esta es normal, el estimador MCO en muestras o o nitas tiene distribucin conocida normal y es posible derivar estad o sticos de contraste vlidos, los a habituales estad sticos t y F con distribucin conocida t-Student y F-Snedecor respectivamente. o As contrastamos q restricciones lineales bajo H0 : R = r versus Ha : R = 0 con el estad stico:
H0 (R r) [ R (V () R ]1 (R r) / q F(q,T K)
F=
(R r) [ R(X X)1 R ]1 (R r)/q H0 F(q,T K) 2
Si q = 1 podemos escribir los estad sticos y distribuciones anteriores como: ( R r) R V ()R

H0
t(T K)
Las distribuciones tabuladas de estos estad sticos nos permiten, estad sticamente, distinguir a un nivel de signicacin elegido si aceptar o no la hiptesis nula dado el valor del estad o o stico obtenido en la muestra. Si F > F(q,T K)| se rechaza la hiptesis nula para un nivel de signicatividad o o dado. O si t > t(T K)| se rechaza la hiptesis nula para un nivel de signicatividad dado. 2 Sin embargo, cuando el estimador no es lineal en u o cuando an sindolo la distribucin de u u e o es desconocida no es posible derivar la distribucin en muestras nitas del estimador MCO. Es o en este escenario cuando es verdaderamente util la teor asinttica ya que si podemos obtener a o la distribucin asinttica del estimador podremos derivar estad o o sticos de contraste vlidos, aunque a asintticos. o Estamos interesados es realizar contraste de hiptesis de la forma H0 : R = r en el modelo de o regresin lineal Y = X + u bajo los supuestos: o E(u) = 0 E(uu ) = 2 IT plim XTX = Q nita, simtrica, denida positiva y no singular e pero no especicamos la funcin de distribucin de u (en particular no suponemos normalidad). o o R es una matriz de constantes conocidas (q K). r es un vector de constantes conocidas (q 1). Contrastamos q restricciones lineales. Si no suponemos normalidad de u, el estad stico F bajo la H0 : R = r es: (RM CO r) [R(X X)1 R ]1 (RM CO r)/q F= M CO 2 12
Anlisis de datos a
SARRIKO-ON 04/10
no tiene porqu distribuirse como una F de Snedecor con (q, T K) grados de libertad, ni tampoco e sabemos como se distribuye para un tamao de muestra dado T. n Sin embargo dado que conocemos la distribucin asinttica del estimador MCO: o o d T (M CO ) N (0, 2 Q1 ) podemos derivar el resultado siguiente: d T (RM CO r) N (0, 2 (RQ1 R )) o lo que es igual
d (RM CO r) [ RV (M CO )R ]1 (RM CO r) 2 (q)
equivalente a (RM CO r) R 2 X X
1
(RM CO r) 2 (q)
y hacer inferencia asinttica vlida con este estad o a stico. Por lo tanto si el tamao de muestra es n sucientemente grande podemos utilizar este estad stico y aproximar su distribucin por la distrio bucin asinttica 2 . Rechazaremos la hiptesis nula si el valor del estad o o o stico obtenido para la (q) muestra utilizada es mayor que un valor cr tico, elegido un valor de signicacin . o Para el caso en que q = 1 si no suponemos normalidad podemos utilizar: RM CO r R(X X)1 R N (0, 1)
d
Luego para un tamao de muestra T dado si ste es sucientemente grande podemos aproximar n e la distribucin exacta de este estad o stico por la distribucin asinttica N (0, 1). Por tanto, para un o o nivel de signicacin elegido , rechazaremos la hiptesis nula si el valor obtenido dada nuestra o o muestra de este estad stico es mayor que el valor cr tico N (0, 1)| . 2 Ejemplo 0.4 En el modelo Yt = 1 + 2 X2t + 3 X3t + ut donde X2t , X3t son no estocstia 2 ). Utilizando el estimador MCO, cmo contrastamos H : = 0 contra cas y ut N IID(0, o 0 3 Ha : 3 = 0? En este modelo los regresores son no estocsticos y la perturbacin es homocedstica y no autocorrea o a lada el estimador de MCO de los parmetros desconocidos es lineal en u, insesgado y de varianza a m nima. Adems dado que conocemos que la perturbacin se comporta como una normal tenemos a o que M CO N (, 2 (X X)1 ) luego 3 N (3 , 2 a33 ) donde V (3 ) = 2 a33 y a33 es el elemento correspondiente en la diagonal de (X X)1 . Dado que en muestras nitas el estimador tiene una distribucin exacta conocida el contraste puede ser realizado o en muestras nitas con el estad stico y distribucin siguientes: o 13
SARRIKO-ON 04/10
Anlisis de datos a
t=
i,M CO H0 t(T K) aii
donde des(3 ) = a33 , 2 = Tu u y a33 es el elemento correspondiente en la diagonal de (X X)1 . K Para un nivel de signicacin elegiremos el valor cr o tico con el que comparar el valor muestral obtenido del estad stico, mirando las tablas de la t-Student. No aceptamos H0 al nivel de signicacin o del 5 % si el valor absoluto del estad stico obtenido con la muestra utilizada es mayor que el valor cr tico t(T K)|0,025 . Ejemplo 0.5 En el modelo Yt = 1 + 2 X2t + 3 X3t + ut donde X2t , X3t son no estocsticas y a 2 ). Utilizando el estimador MCO, cmo contrastamos H : = 0 contra H : = 0? ut ID(0, o 0 3 a 3 En este caso dado que los regresores son no estocsticos y la perturbacin es homocedstica y no a o a autocorrelada el estimador de MCO de los parmetros desconocidos es lineal en u, insesgado y de a varianza m nima. Sin embargo, como no conocemos la distribucin de la perturbacin desconocemos o o la distribucin exacta del estimador. No es posible hacer inferencia en muestras nitas. Por otro o lado, se cumple el Teorema de Mann y Wald por lo que podemos hacer inferencia asinttica con el o estad stico y distribucin siguientes: o 3,M CO d N (0, 1) a33
t=
Para un nivel de signicacin elegiremos el valor cr o tico con el que comparar el valor muestral obtenido del estad stico, mirando las tablas de la normal N (0, 1). Por ejemplo, a un nivel = 5 % ( = 0, 05) dado que la hiptesis alternativa est denida a dos colas tomamos = 0, 025 luego o a 2 (1, 96) = 1 0, 025 = 0, 975. No aceptamos H0 al nivel de signicacin del 5 % si el valor absoluto o del estad stico obtenido con la muestra utilizada es mayor que el valor cr tico N (0, 1)|0,025 = 1, 96. a Ejercicio 0.3 En el modelo Yt = 1 +2 X2t +3 X3t +ut donde X2t , X3t son no estocsticas y ut 2 ). Utilizando el estimador MCO, cmo contratar N ID(0, o as la hiptesis nula de signicatividad o conjunta? Y en ausencia del supuesto de normalidad en la perturbacin? o
0.5.
Qu vamos a aprender en este curso? e
Dec amos al inicio de este tema que la asignatura de Econometr avanza en el estudio de la materia a profundizando en tpicos como: la relajacin de las hiptesis bsicas sobre la perturbacin, los reo o o a o gresores estocsticos y los modelos dinmicos. Para abordar estos tpicos es necesario que relajemos a a o algunas o todas la hiptesis establecidas sobre el comportamiento de las variables del modelo de o regresin lineal general enunciadas en la seccin 0.3. o o Comenzaremos el curso relajando hiptesis sobre el comportamiento de la perturbacin. Si en vez de o o suponer que u es homocedstica y no autocorrelada consideramos la posibilidad de que su varianza a no sea constante y/o que sus covarianzas no sean todas cero nuestro estimador de MCO no ser de a varianza m nima. En este marco ms general derivaremos las propiedades del estimador MCO y a 14
Anlisis de datos a
SARRIKO-ON 04/10
las consecuencias sobre el contraste de hiptesis. Estudiaremos el estimador de M o nimos Cuadrados Generalizados (MCG) y de M nimos Cuadrados Generalizados Factibles (MCGF) cuando MCG no se pueda obtener dado que requiere el conocimiento de E(uu ). Analizaremos las propiedades de ambos y como realizar inferencia. En los Temas 2 y 3 nos emplearemos a fondo en el diseo de E(uu ) bajo supuestos concretos del n comportamiento de la perturbacin que nos permitan considerar que o bien E(u2 ) no es constante o t y/o E(ut us ) no es cero en todos los per odos. En este tema abordaremos por tanto contrates de existencia de heterocedasticidad y de existencia de autocorrelacin. o Una situacin diferente se produce si relajamos el supuesto de que los regresores son no estocsticos o a y suponemos que al menos una de las variables Xit incluidas en la matriz de regresores X es estocstica. En este marco de trabajo el estimador MCO del vector de coecientes desconocidos a no es lineal en la perturbacin ya que es una combinacin no lineal de la matriz de regresores o o estocstica junto con el vector de variables aleatorias u. En este caso la media y varianza del a estimador dependen de la relacin entre X y u, de los supuestos recogidos en su distribucin o o conjunta. Bajo ciertos supuestos el estimador seguir siendo insesgado y de varianza m a nima pero su distribucin en muestras nitas ser desconocida ya que al ser M CO no lineal en u no podemos o a garantizar que tenga una distribucin normal incluso en el caso en que u lo fuera. En esta situacin o o debemos centrarnos en las propiedades asintticas del estimador y si este es consistente y tiene o distribucin asinttica conocida podremos hacer inferencia asinttica. o o o Cmo trabajar en esta situacin es lo que veremos en el Tema 4: Regresores Estocsticos. En este o o a tema nuestro trabajo se centrar en el cumplimiento del Teorema de Mann-Wald. Como hemos a dicho anteriormente si los requisitos i), ii) y iii) de Mann y Wald se cumplen el estimador de MCO es consistente y tiene distribucin asinttica conocida con la que realizar inferencia asinttica. Sin o o o embargo hay muchas situaciones en que estos requisitos no se cumplen. Por ejemplo si Xit y ut estan correladas, E(X u) = 0 y el estimador MCO no ser consistente. En este tema mostraremos a el estimador de Variables Instrumentales de utilidad en esta situacin. o En el Tema 5 y ultimo del curso daremos entrada a los Modelos Dinmicos. Consideraremos la a posibilidad de que haya dinmica tanto en los regresores como en la perturbacin y aplicaremos lo a o aprendido en los cuatro temas anteriores. Durante el curso trabajaremos con un buen nmero de estimadores. El estimador de MCO ser nuesu a tra referencia, cuando mantenga sus propiedades en muestras nitas y/o sus propiedades asintticas o estimaremos por este criterio. Sin embargo en aquellas circunstancias en que las hiptesis estad o sticas establecidas no se cumplan quiz debamos de cambiar de estimador, de ah que aprendamos nuevos a estimadores como M nimos Cuadrados Generalizados, M nimos Cuadrados Generalizados Factibles, Variables Instrumentales o M nimos Cuadrados en dos Etapas. Las propiedades estad sticas de los estimadores dependen tanto del procedimiento de estimacin utilizado como de las hiptesis eso o tad sticas establecidas. Por ello ser fundamental conocer el funcionamiento y propiedades de los a estimadores anteriores para utilizarlos en el marco adecuado; eso es lo que se ha de aprender tal como se reeren las dos primeras competencias espec cas de la asignatura a adquirir:
1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 15
SARRIKO-ON 04/10
Anlisis de datos a
2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e Las dos competencias restantes bsicamente tienen el mismo objetivo, pero por una lado requieren a que adaptis esos conocimientos aprendiendo a utilizar un software estad e stico para aplicar los diferentes estimadores y por otro que seis capaces de aunar todo lo aprendido y darlo forma en un a trabajo nal. 3. Utilizar diversas fuentes estad sticas y adquirir destreza en el uso de un software economtrico e para analizar relaciones entre variables econmicas. o 4. Elaborar en grupos de trabajo y exponer en pblico, un proyecto emp u rico donde se valore adecuadamente los resultados obtenidos del anlisis de un modelo economtrico. a e La docencia de la asignatura se basar en clases magistrales (M), clases prcticas de aula (PA), a a clases prcticas del Centro de Clculo (PO), seminarios (S) y talleres (TA). Cada hora de estas a a clases equivale a una hora presencial. En el cronograma de la asignatura podis ver la distribucin e o de las mismas. Con respecto a las horas no presenciales por cada clase recibida, es decir de tiempo de trabajo no presencial del alumno, las equivalencias son las siguientes, cada clase magistral implica una hora de trabajo no presencial del alumno, mientras que cada clase prctica de aula, prctica de laboratorio a a informtico, de taller o de seminario implica dos horas de trabajo no presencial del alumno. Este a curso conlleva 50 horas de trabajo presencial y 70 horas de trabajo no presencial. En cada uno de los temas siguientes encontraris la exposicin de la materia en las Clases Magise o trales, una muestra de los ejercicios que se realizan en estas as como ejemplos de los ejercicios que se deben realizar en las prcticas de aula y talleres. Los enunciados estn recogidos en la Coleccin a a o de Ejercicios Recomendados y Exmenes de Econometr cuyo enlace podis encontrar en la pgina a a e a web de la asignatura. En este documento para cada tema se han seleccionado una coleccin de ejero cicios recomendados que deber resolver, solo algunos de ellos se resolvern en clase. En la seccin ais a o siguiente incluimos algunos enunciados para practicar los contenidos de este tema introductorio. En las notas siguientes y al nal de cada tema se incluyen preguntas evaluativas de los contenidos del tema a modo de ejemplo de las que podamos utilizar para evaluaros de forma continuada. Se os muestras preguntas cortas evaluativas de las clases magistrales, de las prcticas de aula y de las a prcticas de ordenador. Cada tema cierra con la bibliograf correspondiente al mismo. a a
0.6.
Ejercicios para practicar

t = 1, . . . , T donde Xt y Zt son variables
Ejercicio 0.4 En el modelo Yt = 1 + 2 Xt + 3 Zt + ut 2 no estocsticas y ut iid(0, u ). se pide: a
1. Obtener la propiedades del estimador MCO tanto en muestras nitas como asintticas. o 16
Anlisis de datos a 2. Obtener su distribucin asinttica. o o 3. Indica como contrastar H0 : 2 = 3 as
SARRIKO-ON 04/10
Ejercicio 0.5 En el modelo Yt = Xt +ut t = 1, 2, . . . , T ut iid(0, 2 ), Xt no estocstica. a Consideramos los siguientes estimadores del parmetro desconocido : a M CO = Xt Yt 2 Xt = Yt Xt = Xt Yt Yt2
1. Demostrar las propiedades en muestras nitas de los tres estimadores. 2. Demostrar que los tres estimadores son consistentes.
Ejercicio 0.6 Comentar la siguiente armacin: Los estimadores consistentes son asintticamente o o insesgados y viceversa.
o Ejercicio 0.7 Comentar la siguiente armacin: Un estimador sesgado no puede ser consistentes porque insesgadez asinttica y consistencia son trminos equivalentes. o e
ut iid(0, 2 ), se dene el siguiente estimador Ejercicio 0.8 Sea modelo: Yt = + Xt + ut del parmetro desconocido : a YT Y1 = ut (0, 2 ) XT X1 Comprueba si es insesgado, de m nima varianza y consistente. Problema 0.1 Supongamos el modelo correctamente especicado: Yt = 1 + 2 X1t + 3 X2t + ut t = 1, 2, . . . , T
X1t , X2t no estocsticas t, ut iid(0, 2 ). Pero especicamos el modelo: a Yt = 1 + 2 X1t + vt t = 1, 2, . . . , T
1. Demuestra que el estimador MCO de 2 en el modelo estimado es inconsistente. 2. Demuestra que el estimador MCO de 1 en el modelo estimado es inconsistente.
17
SARRIKO-ON 04/10 Ejercicio 0.9 Sea el modelo: Yt = + ut Denimos el siguiente estimador: = donde ct 1 T
T t=1
Anlisis de datos a
ut (0, 2 ) Yt ct
t = 1, 2, . . . , T es una serie no aleatoria tal que c= 1 T

T t=1
1 =1 ct
Se pide: 1. Demostrar las propiedades del estimador en muestras nitas. 2. Demostrar que el estimador es consistente. 3. Obtener su distribucin asinttica. o o
ut iid(0, 2 ) encontrar las proEjercicio 0.10 En el modelo: Yt = + ut t = 1, 2, . . . , T piedades en muestras nitas y propiedades asintticas del estimador MCO. Obtener su distribucin o o asinttica bajo el supuesto de normalidad y en la ausencia de este supuesto. o
18
Anlisis de datos a
SARRIKO-ON 04/10
0.7.
Anexo: Demostracin de la consistencia del estimador MCO o
Para demostrar la consistencia del estimador MCO podemos tomar diferentes v En el tema se ha as. desarrollado la demostracin utilizando el Teorema de Mann y Wald y tambin por las condiciones o e sucientes de consistencia. Pero tambin podemos demostrar la consistencia del estimador utilizando e la dinicin de consistencia y buscando el l o mite en probabilidad del estimador. Vamos a hacerlo as para practicar los conceptos vistos. A) Demostracin de la consistencia del estimador MCO por las condiciones sucientes de consiso tencia. lim E(M CO ) =
T T
lim V (M CO ) = 0
condiciones sucientes a demostrar que se cumplen. a.1) E() = E( + (X X)1 X u) = + (X X)1 X E(u) = si X es no estocstica y E(u) = 0. a = lim E() = lim () =
T T
luego M CO es un estimador asintticamente insesgado. o a.2) V ar() = 2 (X X)1 =

2 T 1 TX
y se satisface para cualquier T dado si u N (0, 2 I). 2 T

1
lim V ar() = lim
1 XX T
2 = lim lim T T T si
T
1 XX T
= 0 Q1 = 0
lim
1 TX
es una matriz nita q positiva denida. Luego por las condiciones sucientes plim(T )M CO =
y M CO es un estimador consistente. B) Demostracin de la consistencia de M CO utilizando la denicin de consistencia. o o M CO no necesitamos conocer E((T )M CO ) ni V ((T )M CO ). Para demostrarlo aplicando plim M CO = + (X X)1 X u = + plimM CO = plim + plim = + plim 1 XX T 19 1 XX T
1 1
1 Xu T
1 XX T
1
1 Xu T
plim
1 Xu T
SARRIKO-ON 04/10 Sabemos que: plim

1 TX
Anlisis de datos a
X = Q = plim
1 TX
= Q1
y necesitamos encontrar:
1 plim T T ut t=1 plim 1 T X ut t=1 2t T 1 plim T X u = . . . 1 plim T T Xkt ut t=1
=?
1 Dado que se cumple Mann y Wald sabemos que plim T X u = 0. Sin embargo, como estamos haciendo el ejercicio sin utilizar el teorema de Mann y Wald vamos a buscar el resultado aplicamos las condiciones sucientes de consistencia:
(1) E
1 TX
u =
1 TX
E(u) = 0 t = lim E
T
1 TX
u =0 =0Q=0
(2) V ar
1 TX
u =
2 X X T T
= lim V ar
T
1 TX
u = lim
2 lim X X T T T T
por (1) y (2) plim y por tanto 1 Xu T =0
plim(T )M CO = + Q1 0 =
luego M CO es un estimador consistente.
20
Tema 1
M nimos Cuadrados Generalizados

Clases Magistrales
Las clases magistrales son clases en las cuales el profesor desarrolla la parte terica de la asignatura, o pero tambin tienen una vertiente prctica, ya que en ellas se resuelven ejercicios en pizarra. A e a pesar de que evidentemente el peso de la clase lo lleva el profesor, es necesaria la participacin del o alumno en los siguientes trminos: es importante leer con antelacin a la clase el material distribuido. e o Adems, resulta conveniente que el alumno intente hacer por s mismo los ejercicios propuestos para a resolver apoyndose en las notas tomadas en clase. a De esta forma el alumno puede darse cuenta de aquellos puntos que ha entendido o no, le surgirn a dudas y en resumen avanzar en su aprendizaje mucho ms que si se limita a ser notario de lo a a que el profesor realiza en la pizarra. Por ello de antemano, en clase y en la plataforma docente, se indicar qu ejercicios se proponen para resolver y en qu clase magistral sern resueltos en la a e e a conanza de que el alumno invertir tiempo de trabajo personal en ellos. Por cada clase magistral a el alumno debe invertir en casa una hora de trabajo personal. En el tema de M nimos Cuadrados Generalizados habitualmente se dispone de tres clases magistrales. Son clases de carcter fundamentalmente terico dedicadas a analizar las consecuencias de a o relajar las hiptesis bsicas sobre la matriz de varianzas y covarianzas de la perturbacin en las o a o propiedades del estimador MCO. Se introducen los problemas de heterocedasticidad y/o autocorrelacin. Finalmente, se presentan los estimadores de M o nimos Cuadrados Generalizados y M nimos Cuadrados Generalizados Factibles, sus propiedades y brevemente, cmo hacer inferencia con estos o estimadores. Es un tema claramente instrumental. A continuacin en los dos temas siguientes, Heterocedasticidad y Autocorrelacin, se estudian a o o fondo estos dos problemas. Por ello, el tiempo dedicado a resolver ejercicios es muy reducido.
Competencias a trabajar en estas sesiones: 1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 21
SARRIKO-ON 04/10
Anlisis de datos a
2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e
Al nal de este tema deber ais ser capaces de: 1. Explicar las implicaciones que tiene para la estimacin M o nimo Cuadrtica Ordinaria el hecho a de que la matriz de varianzas y covarianzas del vector de perturbaciones de un modelo no sea escalar. 2. Derivar y comparar las propiedades en muestras nitas y grandes del estimador de M nimos Cuadrados Ordinarios y el estimador de M nimos Cuadrados Generalizados bajo perturbaciones no esfricas. e 3. Explicar las consecuencias en el estimador de M nimos Cuadrados Generalizados de que la matriz de varianzas y covarianzas del vector de perturbaciones de un modelo sea desconocida. Derivar un estimador alternativo en este caso, el estimador de M nimos Cuadrados Generalizados Factibles, y conocer sus propiedades. 4. Conocer la forma de realizar contrastes vlidos sobre los parmetros de inters. a a e
Bibliograf Recomendada: a Al nal del tema tenis recogida la bibliograf correspondiente. En particular os recomendamos e a leer los cap tulos correspondientes a la bibliograf bsica detallados a continuacin : a a o Greene, W. (1998), cap. 11 y cap. 15. Ramanathan, R. (2002), cap. 8 y cap. 9. Wooldridge, J. M. (2003), cap. 8, cap. 11 y cap. 12. Y para profundizar, podis leer los cap e tulos detallados a continuacin correspondientes a la biblioo graf complementaria: a Alonso, A. et al. (2005), cap. 8. Gujarati, D. (2004), cap. 11 y cap. 12. Johnston, J. (1984), cap. 7. Maddala, G. S. (1996), cap. 5 y cap. 6. Novales, A. (1993), cap. 5 y cap. 8.
22
Anlisis de datos a
SARRIKO-ON 04/10
1.1.
Modelo de regresin con perturbaciones no esfricas o e
En el tema de M nimos Cuadrados Generalizados vamos a relajar dos de las hiptesis bsicas sobre o a la perturbacin. Hasta ahora hemos supuesto que la perturbacin era homocedstica, V ar(ut ) = o o a 2 t, y no autocorrelada, Cov(u , u ) = 0 t, s t = s, lo que en la literatura economtrica e t s se conoce como perturbaciones esfricas. En este tema vamos a relajar estas dos hiptesis bsicas, e o a permitiremos que exista heterocedasticidad y/o autocorrelacin. Escribimos estas hiptesis como: o o
2 - heterocedasticidad: V ar(ut ) = t
- autocorrelacin: Cov(ut , us ) = 0, o
t, s t = s
Para el propsito de estimacin distinguir entre heterocedasticidad y/o autocorrelacin no es neo o o cesario ya que en ambos casos el modelo se estima de la misma manera, por ello en este tema presentaremos el estimador M nimo Cuadrtico Generalizado y sus propiedades, comunes a ambos a casos. En los dos temas siguientes veremos los problemas de heterocedasticidad y autocorrelacin o por separado particularizando en cada uno de ellos. Nuestro marco de trabajo queda denido como sigue: Yt = 1 + 2 X2t + . . . + K XKt + ut t = 1, 2, . . . , T Yt = Xt + ut
mantenemos que los regresores Xt = [ 1 X2t . . . XKt ] son no estocsticos y sobre las perturbaa ciones suponemos: E(ut ) = 0 t, media cero 2 E(u2 ) = t t = 1, 2, . . . , T , varianza no constante y/o t E(ut us ) = 0 t, s t = s, covarianzas no nulas, En trminos matriciales el modelo se escribe: e Y
(T 1)
+ u
(T 1)
(T K) (K1)
y la estructura de la matriz de varianzas y covarianzas del vector de perturbaciones que recoge los supuestos anteriores sobre u ser una matriz no escalar como la siguiente: a E(uu ) = =
2 1 21 . . .
12 2 2 . . .
T 1 T 2 = 2 = 2 w11 w21 . . .
1T 2T . .. . . . 2 T
w12 w22 . . .
wT 1 wT 2 23
w1T w2T . .. . . . wT T
SARRIKO-ON 04/10 donde

2 V ar(ut ) = t = 2 wtt ,
Anlisis de datos a
t = 1, ..., T t=s
Cov(ut , us ) = ts = st = 2 wts ,
Es decir, la varianza de la perturbacin puede cambiar en cada momento y puede existir autocorreo lacin entre perturbaciones de distintos momentos del tiempo. Adems, podemos suponer que existe o a un factor de escala comn a todos los elementos, el parmetro 2 , que perfectamente puede tomar u a el valor de la unidad. Vamos a empezar viendo ejemplos en los que la hiptesis de perturbaciones esfricas no se cumple: o e Ejemplo 1.1 Supongamos una muestra de observaciones de seccin cruzada relativas a gastos de o consumo familiares, C, y renta disponible, R, de un colectivo de N familias. La perturbacin mide o la diferencia entre el consumo de una familia y el consumo medio de todas las familias que poseen la misma renta, ui = Ci E(Ci /Ri ), y 2 mide la dispersin de estas observaciones. En familias con o rentas bajas, las posibilidades de consumo estn restringidas por la renta. Sin embargo, a medida que a aumenta la renta se ampl las posibilidades y podrn decidir cuanto consumir y cuanto ahorrar. an a As podemos encontrarnos con familias de rentas altas ahorrativas, con bajo consumo, y otras con , alto consumo y poco ahorro. En este caso hay una gran dispersin del consumo y 2 ser grande o a mientras que para las rentas bajas 2 ser pequea ya que tienen menos posibilidades de variar su a n consumo dad su renta. En este supuesto la varianza de la perturbacin cambia segn la renta de o u las familias, existe heterocedasticidad y podemos escribirla por ejemplo como E(u2 ) = 2 Ri . i En el caso de datos de seccin cruzada, y si suponemos que no existe correlacin entre perturbaciones o o de distintos individuos, la matriz de varianzas y covarianzas de la perturbacin ser o a: 2 1 0 0 0 2 0 2 E(uu ) = = . . .. . . . . . . . . 0 donde suponemos E(ui ) = 0 i i = 1, . . . , N, 0
2 N 2 E(u2 ) = i , y E(ui uj ) = 0 i, j i = j. i
Ejemplo 1.2 Supongamos que analizamos la funcin de formacin de precios de una accin de un o o o banco con fuerte participacin en el negocio de la construccin en los Emiratos Arabes. Creemos o o que los precios de las acciones dependen de las reservas del banco, de su volumen de negocio y de los benecios obtenidos, entre otros factores que afectan en la media del nivel de precios. Una quiebra no esperada del negocio en dichos Emiratos afectar negativamente a sus resultados y a a la conanza que los agentes del mercado tienen depositada en el banco. Este shock no predecible ser recogido por la perturbacin del modelo, ut . Resulta razonable pensar que el shock no va a a o afectar unicamente a un periodo t, si no que los agentes recuperaran la conanza lentamente por lo que parte de ese shock se mantendr en el futuro. Si esto es as lo que ocurre en un per a , odo actual depende de lo ocurrido en el periodo pasado y ser dif mantener E(ut ut1 ) = 0, es decir, a cil que las perturbaciones de los momentos t y t 1 estn incorrelacionadas. Ocurrir lo contrario, e a 24
Anlisis de datos a
SARRIKO-ON 04/10
que las perturbaciones estn correlacionadas. Para el caso general podemos recoger la existencia de a autocorrelacin denotndola como : o a E(ut us ) = 0 t, s t = s En este caso, para datos de serie temporal, y suponiendo que la varianza es constante, escribimos la matriz de varianzas y covarianzas de la perturbacin bajo el supuesto de autocorrelacin como: o o E(uu ) = = 2 21 . . . 12 2 . . . 1T 2T . .. . . . 2
T 1 T 2
Ejemplo 1.3 Supongamos que queremos estimar la demanda de automviles Y como una funcin o o de la renta X, utilizando datos microeconmicos sobre gastos de las familias en dos ncleos geoo u grcos distintos, ncleo urbano y ncleo rural. La funcin de demanda para las familias del ncleo a u u o u urbano es: 2 Y1i = 1 + 1 X1i + u1i i = 1, . . . , N1 u1i N (0, 1 IN1 ) La funcin de demanda para las familias del ncleo rural es: o u Y2j = 2 + 2 X2j + u2j j = 1, . . . , N2
2 u2j N (0, 2 IN2 )
Supongamos que la propensin marginal a consumir de ambos ncleos es la misma, 1 = 2 . En o u este caso deber amos estimar la funcin de demanda en el siguiente modelo conjunto: o 1 Y1 iN1 0 X1 u1 2 + = = Y X + u Y2 0 iN2 X2 u2 ((N1 +N2 )1) ((N1 +N2 )3) (31) ((N1 +N2 )1) Suponiendo ambas muestras independientes, el vector de medias y la matriz de varianzas y covarianzas del vector de perturbaciones del sistema de ecuaciones a estimar es: E(u) = 0 0 = 0(N1 +N2 )1 E(uu ) =
2 1 IN1 0
0 2 2 IN2
= (N1 +N2 )(N1 +N2 )
Puede ocurrir que la variacin en el gasto en automviles dada una renta, sea mayor en el ncleo o o u 2 2 urbano que en el rural, esto es 1 > 2 , en este caso, en el modelo a estimar la perturbacin es o 2 2 heterocedstica ya que 1 = 2 . a Adems, las muestras no tienen porque ser independientes podr ocurrir que an en el caso de que a a u la variacin en el gasto de automviles fuese la misma en la zona urbana que en la rural, hubiese o o factores que siendo no signicativos en media en las respectivas demandas implicasen dependencia entre u1 y u2 , tal que 12 = 0. En este caso las ecuaciones estar relacionadas a travs del trmino an e e 1. de perturbacin y E(uu ) = = I tal que o E(uu ) = 2 IN1 12 IN 12 IN 2 IN2 = (N1 +N2 )(N1 +N2 )
1 2 2 Estas no son las unicas posibilidades. Por ejemplo podemos pensar en 1 > 2 y 12 = 0 o cualquier otra combinacin de posibilidades. o
25
SARRIKO-ON 04/10
Anlisis de datos a
Como se puede observar hay muchas y diversas situaciones en que pueden aparecer los problemas de heterocedasticidad y/o autocorrelacin. En general la heterocedasticidad aparece con mayor o probabilidad en datos de seccin cruzada mientras que la autocorrelacin es ms fcil encontrarla o o a a con datos de serie temporal. Dado que la existencia de heterocedasticidad y/o autocorrelacin o implica que algunas de las hiptesis bsicas utilizadas para derivar las propiedades del estimador o a MCO no se cumplen, debemos empezar viendo que implicaciones tiene en el estimador de MCO y sus propiedades el hecho de que la matriz de varianzas y covarianzas de la perturbacin no sea ya o una matriz escalar.
1.2.
Propiedades del estimador de MCO
Sea el Modelo de Regresin Lineal General, Y = X + u, donde se mantienen las hiptesis bsicas o o a 2: salvo que E(uu ) = = 2 , donde = I (1.1)
El estimador MCO de , M CO = (X X)1 X Y , en muestras nitas sigue siendo lineal e insesgado, pero no es varianza m nima. En muestras grandes o asintticas es consistente. Prueba: o Lineal: dado que X es no estocstica el estimador MCO es lineal en u, ya que se puede a escribir como una combinacin lineal del vector de perturbaciones u y la matriz de constantes o D = (X X)1 X , siendo u lo unico aleatorio de su expresin: o M CO = + (X X)1 X u = + D u Insesgado: dado que X es no estocstica y E(u) = 0 el estimador MCO es insesgado. a E(M CO ) = + E[ (X X)1 X u ] = + (X X)1 X E(u) = Matriz de varianzas y covarianzas: V (M CO ) = E[( E())( E()) ] = E[( )( ) ] = E[(X X)1 X uu X(X X)1 ] = (X X)1 X E(uu ) X(X X)1 = 2 (X X)1 X X(X X)1 Bajo heterocedasticidad y/o autocorrelacin el estimador MCO no es el estimador con vao rianza m nima entre los estimadores lineales e insesgados. Si = I veremos que existe un estimador que alcanza la cota de varianza m nima, y que es el eciente entre los estimadores lineales e insesgados en esta situacin. o
2 Para el propsito de la demostracin es indiferente que en la matriz de varianzas y covarianzas exista o no factor o o de escala distinto de la unidad. En lo que sigue supondremos que E(uu ) = 2 .
26
Anlisis de datos a
SARRIKO-ON 04/10
Distribucin en muestras nitas3 : Si las perturbaciones tienen una distribucin normal o o u N (0, 2 ) M CO N (, 2 (X X)1 X X(X X)1 ) Consistente: El estimador MCO bajo perturbaciones no esfricas es consistente. Vamos a e demostrar la consistencia del estimador utilizando las condiciones sucientes de consistencia. Sean:
T
lim
XX T
= Q nita, denida positiva = Z nita, denida positiva
lim
X X T
Entonces:
T
lim E(M CO ) = lim 2 T XX T

1
lim V (M CO ) =
X X T
XX T
= 0 Q1 Z Q1 = 0, por lo que el estimador es consistente: plim M CO = .
1.2.1.
Estimador de la matriz de varianzas y covarianzas de M CO
El estimador MCO de es lineal e insesgado en muestras nitas. Su matriz de varianzas y cova rianzas se dene V (M CO ) = 2 (X X)1 X X(X X)1 . Un estimador de la matriz de varianzas y covarianzas del estimador MCO es V (M CO ) = 2 (X X)1 siendo 2 = Tu u . Utilizar este es K timador para hacer inferencia cuando la matriz de varianzas y covarianzas de la perturbacin del o 2 , = I, no es adecuado. Los estad modelo no es escalar, E(uu ) = sticos t y F habituales para hacer inferencia sobre denidos en base a este estimador de la matriz de varianzas y covarianzas de M CO son inapropiados ya que V (M CO ) = 2 (X X)1 es un estimador sesgado e inconsisten te. Dichos estad sticos ahora no tienen las distribuciones t-Student y F -Snedecor habituales por lo tanto, la inferencia en base a ellos no es vlida. a Por todo ello parece ms adecuado buscar un nuevo estimador del vector de coecientes que a tuviera en cuenta que E(uu ) = 2 , con denida bien para el caso de heterocedasticidad, bien para el caso de autocorrelacin, bien para ambos, y que fuese lineal, insesgado, de varianza m o nima y consistente. Este estimador es el de M nimos Cuadrados Generalizados y a su vez permite proponer un estimador insesgado para 2 y realizar inferencia vlida. El unico requisito para poder obtenerlo a es que sea conocida. En el caso de que no exista factor de escala 2 = y requerimos que sea conocida.
Es importante recordar que M CO es lineal en u. Esto implica que su distribucin en muestras nitas coincide con o la distribucin de u, independientemente de cul sea sta. En nuestro caso como suponemos a u normal el estimador o a e MCO tendr distribucin normal. a o
3
27
SARRIKO-ON 04/10
Anlisis de datos a
1.3.
Mtodo de M e nimos Cuadrados Generalizados (MCG)
Supongamos el MRLG Y = X + u donde E(u) = 0 y E(uu ) = 2 , siendo conocida y se cumplen el resto de hiptesis bsicas. Si lo que queremos es estimar los coecientes desconocidos o a de forma que el estimador sea eciente, una manera adecuada de proceder es transformar el modelo tal que sus perturbaciones sean esfricas, es decir, de media cero, varianza constante y covarianzas e cero. El estimador de MCO en el modelo as transformado ser lineal, insesgado, de varianza m a nima o eciente y consistente. Vemoslo. a Dado que = 2 es simtrica y semidenida positiva, y hemos supuesto que es conocida, existe e una matriz no singular P tal que = P P . Adems, P es conocida y no estocstica. La inversa de a a la matriz P se utiliza como matriz de transformacin del modelo original dado que: o = PP
1
= (P P )1 = (P )1 P 1
P 1 (P )1 = P 1 P P (P )1 = I Premultiplicando el modelo por P 1 obtenemos el siguiente modelo transformado: P 1 Y = P 1 X + P 1 u Y = X + u Y X u Este modelo transformado tiene perturbaciones, u , esfricas, es decir, de media cero, varianza e constante y covarianzas cero: E(u ) = E(P 1 u) = P 1 E(u) = 0 E(u u ) = E(P 1 uu (P 1 ) ) = P 1 E(uu )(P 1 ) = = 2 P 1 P 1 = 2 P 1 P P (P )1 = 2 I. Por lo tanto, en el modelo transformado se cumplen las hiptesis bsicas, y el estimador MCO teno a dr las propiedades habituales de linealidad, insesgadez y varianza m a nima. Si denimos el estimador de MCO en el modelo transformado, y sustituimos las matrices transformadas por su expresin en o trminos de las variables originales del modelo, obtenemos la expresin del estimador de M e o nimos Cuadrados Generalizados, MCG, en el modelo de inters. As e : 1 (1.2) M CO = (X X ) X Y = = (X (P )1 P 1 X)1 X (P )1 P 1 Y = = (X 1 X)1 X 1 Y = M CG Si ( en su caso) es conocida el estimador es inmediatamente calculable. o Criterio de estimacin y funcin objetivo: o o El estimador de MCG dado por la expresin (1.3) puede ser obtenido minimizando la siguiente o funcin objetivo: o M in u 1 u = M in (Y X ) 1 (Y X ) = M in (Y X ) (Y X ) Utilizando las condiciones de primer orden podemos derivar el sistema de ecuaciones normales X 1 Y = (X 1 X)1 de donde obtenemos M CG = (X 1 X)1 X 1 Y . 28 (1.3)
Anlisis de datos a
SARRIKO-ON 04/10
1.3.1.
Propiedades del estimador de MCG
Como ya se ha dicho el estimador de MCG es un estimador lineal, insesgado y de varianza m nima en muestras nitas, en muestras grandes es consistente y eciente asintticamente. Las propiedades o del estimador MCG podemos demostrarlas alternativamente en el modelo transformado utilizando la expresin (1.2) o en el modelo original utilizando la expresin (1.3). o o Lineal: dado que X y son no estocsticas el estimador MCG es lineal en la perturbacin a o u, ya que se puede expresar como una combinacin lineal del vector de perturbaciones u y la o matriz de constantes no estocstica C = (X 1 X)1 X 1 , siendo u lo unico aleatorio de a su expresin: o M CG = (X 1 X)1 X 1 Y = + (X 1 X)1 X 1 u = + C u Insesgado: Dado que X y son no estocsticas y E(u) = 0 el estimador MCG es insesgado: a E(M CG ) = + E[ (X 1 X)1 X 1 u ] = = + (X 1 X)1 X 1 E(u) = Matriz de varianzas y covarianzas: V (M CG ) = E[( E())( E()) ] = E[( )( ) ] = E[(X 1 X)1 X 1 uu 1 X(X 1 X)1 ] = (X 1 X)1 X 1 E(uu ) 1 X(X 1 X)1 = 2 (X 1 X)1 X 1 1 X(X 1 X)1 = 2 (X 1 X)1 Cuando E(uu ) = 2 = I y es conocida, el estimador MCG de es el de menor varianza entre los estimadores lineales e insesgados. Distribucin en muestras nitas: Bajo el supuesto de normalidad de las perturbaciones, o u N (0, 2 ), tenemos que M CG N (, 2 (X 1 X)1 ) Consistente: Podemos demostrar la consistencia del estimador mediante las condiciones sucientes de consistencia: 1 Sea plim X X = G, nita, semidenida positiva y no singular, entonces T
T
lim E(M CG ) = lim V(M CG ) = lim 2 T X 1 X T

1
= 0 G1 = 0
luego plim M CG = , con lo que el estimador es consistente. 29
SARRIKO-ON 04/10 Distribucin Asinttica: Dado que o o plim M CG = = M CG = (M CG ) 0

p p
Anlisis de datos a
el estimador tiene una distribucin degenerada en el l o mite, por lo que buscamos la distribucin o asinttica para T (M CG ) o T (M CG ) = X 1 X T
1
X 1 u T
En el modelo original el teorema de Mann-Wald no se puede aplicar, por lo que demostrar la consistencia es un poco ms costoso que si lo hacemos en el modelo transformado. En a el modelo transformado las perturbaciones son esfricas y X es no estocstica por lo que e a podemos aplicar el Teorema de Mann-Wald. Vamos a mostrar como utilizarlo en la obtencin o M CG . de la distribucin asinttica de o o i) Sea u iid(0, 2 I) ii) Sea E(X u ) = X E(u ) = 0 ya que X es no estocstica, a iii) Sea plim X X T = Q = G nita y no singular
Entonces se cumplen los dos resultados siguientes: 1. plim X u T =0
d 2. X u N (0, 2 G) T
por lo que de Mann-Wald, y utilizando el teorema de Cramer, tenemos

T (M CO ) = X X T
1
X u T
N (0, 2 G1 )
de donde T (M CG ) = con G = plim X

1 X . T
X 1 X T
X 1 u d N (0, 2 G1 ) T
1.3.2.
Estimador de la matriz de varianzas y covarianzas de M CG
El estimador de MCG es lineal, insesgado y de varianza m nima. Cuando E(uu ) = 2 , a pesar de 2 ser desconocida y su matriz de varianzas y covarianzas habr de que sea conocida, en general a a M CG ) insesgado y consistente es ser estimada. Un estimador de V ( V (M CG ) = M CG (X 1 X)1 = M CG (X X )1 2 2 30
Anlisis de datos a siendo M CG = 2
SARRIKO-ON 04/10
uM CG 1 uM CG u u = T K T K
Puede resultar util tener las expresiones anteriores en trminos de las variables del modelo tal que: e M CG = 2 M CG = 2 = Y Y M CG X Y u u (Y X M CG ) (Y X M CG ) = = T K T K T K 1 u uM CG M CG = T K Y 1 Y M CG X 1 Y (Y X M CG ) 1 (Y X M CG ) = T K T K
Ejercicio 1.1 En el modelo Y = X + u donde E(u) = 0, E(uu ) = 2 con conocida y X es no estocstica. Demostrar la consistencia del estimador MCG utilizando el modelo transformado y a el Teorema de Mann-Wald. Ejercicio 1.2 En el modelo Y = X + u donde E(u) = 0, estocstica. Se pide: a E(uu ) = , conocida y X es no
1. Escribir la funcin objetivo. Obtener las ecuaciones normales y derivar el estimador MCG. o 2. Demostrar sus propiedades en muestras nitas y asintticas. o 3. Obtener su distribucin en muestras nitas y asintticas. o o
Ejercicio 1.3 En el modelo Yi = 1 + 2 Xi + ui i = 1, . . . , 20 donde X es no estocstica, a E(ui ) = 0 i, V ar(ui ) = 2 Xi , y Cov(ui uj ) = 0 i = j. Se pide: 1. Escribir la funcin objetivo. o 2. Obtener las ecuaciones normales y derivar el estimador MCG de 1 y 2 .
1.4.
Mtodo de M e nimos Cuadrados Generalizados Factibles (MCGF)
Hasta ahora hemos supuesto que conoc amos o en E(uu ) = 2 = , pero en la prctica la a mayor de las veces (o ) son desconocidas. En este caso el estimador MCG no es directamente a calculable ya que en su expresin aparecen estas matrices. La solucin habitual es sustituir (o ) o o por una estimacin suya en la expresin del estimador de MCG. Este es el estimador de M o o nimos Cuadrados Generalizados Factibles, MCGF: M CGF = (X 1 X)1 X 1 Y 31 (1.4)
SARRIKO-ON 04/10
Anlisis de datos a
Notar que sustituir por una estimacin suya implica hacer un supuesto de comportamiento, es o decir, suponer una forma funcional para los elementos de que son desconocidos. Una vez supuesta una forma funcional, que en general depender de un conjunto de parmetros desconocidos y a a variables exgenas, es necesario estimar esos parmetros desconocidos4 . Cmo proponer una forma o a o funcional para los elementos de y cmo estimar los parmetros desconocidos de esta forma funo a cional es algo que se ver en los temas siguientes, con cada caso en concreto, heterocedasticidad y/o a autocorrelacin. o Ahora vamos a limitarnos a estudiar las propiedades del estimador MCGF una vez supuesto que hemos sido capaces de proponer una forma funcional sensata a la informacin disponible sobre el o comportamiento de las varianzas y covarianzas del vector de perturbaciones. Adems, hemos sido a capaces de estimar de forma consistente los parmetros desconocidos de los que dependen estos a momentos. Es decir, disponemos de estimador consistente de .
1.4.1.
Propiedades del estimador de MCGF
Bajo el supuesto de que las varianzas de las perturbaciones se han modelado correctamente, el estimador MCGF en muestras nitas es un estimador no lineal y sesgado en general, su distribucin o en muestras nitas no es conocida. En muestras grandes, bajo ciertas condiciones de regularidad, y si es un estimador consistente de , el estimador MCGF es consistente, asintticamente eciente o y tiene distribucin asinttica conocida. o o Linealidad: El estimador MCGF no es lineal en u. M CGF = + (X 1 X)1 (X 1 u) En la expresin del estimador MCGF aparecen u y , ambas son variables aleatorias, ya que o que ahora es un estimador, luego es una matriz estocstica. Por tanto, M CGF es una funcin a o no lineal de u y . Insesgadez y matriz de varianzas y covarianzas: En general el estimador de MCGF es sesgado: E(M CGF ) = + E[(X 1 X)1 (X 1 u)] = Para determinar E[(X 1 X)1 (X 1 u)] necesitamos conocer la distribucin conjunta de o 1 X)1 (X 1 u)] = 0 y por tanto las variables aleatorias en y en u. En general E[(X E(M CGF ) = . Adems, V (M CGF ) = E[M CGF E(M CGF )][M CGF E(M CGF )] es a una expresin dif de obtener anal o cil ticamente. Las propiedades en muestras nitas y la distribucin exacta del estimador MCGF son desconocidas. Por lo tanto, en muestras nitas su o comportamiento es dif de comparar con el de MCO e incluso puede ser peor. cil Consistencia: Bajo ciertas condiciones de regularidad, y si es un estimador consistente de , el estimador MCGF es consistente, plim M CGF = .
El n mero de parmetros desconocidos es limitado ya que en otro caso no se podr estimar los K coecientes u a an del modelo y los T (T + 1)/T elementos desconocidos en la matriz de varianzas y covarianzas de la perturbacin con o T observaciones.
4
32
Anlisis de datos a
SARRIKO-ON 04/10
Distribucin asinttica: En general si las condiciones anteriores se satisfacen el estimador o o MCGF es asintticamente equivalente al estimador MCG y su distribucin asinttica coincide o o o y por tanto es asintticamente eciente dentro de esta clase. As se puede demostrar que o , d T (M CGF ) N (0, 2 G1 ) con G = plim X
1 X . T
1.4.2.
Estimador de la matriz de varianzas y covarianzas de M CGF
Cuando E(uu ) = 2 y decimos que es desconocida en realidad nos estamos reriendo a que 2 es desconocido. Parece complicado ser capaces de establecer que E(uu ), que es desconocida, tiene un elemento comn, o factor de escala, a todos sus elementos que tambin es desconocido y distinto u e de . Lo lgico es pensar en E(uu ) = , desconocida. Un estimador consistente de V (M CGF ) o M CGF ) = (X 1 X)1 . es V ( Sin embargo, y por si fuera el caso de que, siendo desconocida existe este factor de escala 2 , tambin desconocido en E(uu ), un estimador consistente de la matriz de varianzas y covarianzas e asinttica del estimador de MCGF es V (M CGF ) = M CGF (X 1 X)1 siendo o 2 M CGF = 2 uM CGF 1 uM CGF T K y uM CGF = Y X M CGF
Es importante recalcar que la propiedad de consistencia es invariante a tener en el denominador (T K) o T . Ejercicio 1.4 En el modelo Y = X + u donde E(u) = 0, no estocstica. Se pide: a 1. Escribir la expresin del estimador MCGF. o 2. Demostrar sus propiedades en muestras nitas y asintticas. o 3. Obtener su distribucin asinttica. o o E(uu ) = , desconocida y X es
1.5.
Contrastes de restricciones lineales
Una vez hemos estimado los coecientes del modelo de manera apropiada estaremos interesados en realizar contraste de hiptesis. Vamos a ver cmo realizar contrastes de restricciones lineales sobre o o el vector en el MRLG con perturbaciones no esfricas. e Sean las hiptesis nula y alternativa para el contraste de q restricciones lineales: o H0 : R = r Ha : R = r 33
SARRIKO-ON 04/10
Anlisis de datos a
donde R es una matriz (q K) y r es un vector de dimensin (q 1), siendo q el nmero de o u restricciones lineales a contrastar. Estad sticos basados en el estimador de por MCG. En este caso Y = X + u u N (0, 2 ) y es conocida
el estimador MCG es lineal en u, insesgado y de varianza m nima, su distribucin en muestras nitas o es: M CG N (, 2 (X 1 X)1 ) Estad sticos de contraste y distribucin asociada: o Para q = 1 RM CG r R V (M CG ) R luego RM CG r R (X 1 X)1 R
H0 H0
t(T K)
t(T K)
Si el valor muestral del estad stico, t, es tal que t < t(T K)| no rechazamos la H0 para un nivel de 2 signicacin . o Para q > 1 1 H0 (R r) [R V (M CG ) R ]1 (R r) F(q,T K) q luego (RM CG r) [R (X 1 X)1 R ]1 (RM CG r)/q H0 F(q,T K) 2 Si el valor muestral del estad stico, F, es tal que F < F(q,T K)| no rechazamos la H0 para un nivel de signicacin . o
Ejercicio 1.5
Sea el modelo: Y = X + u u N (0, 2 ) conocida y X no estocstica a
Escribe el estad stico general y distribucin asociada para el contraste de q restricciones lineales en o el modelo transformado. Detalla cada uno de sus elementos y la regla de decisin. o
34
Anlisis de datos a
SARRIKO-ON 04/10
Ejercicio 1.6 En el modelo Yi = 1 + 2 X2i + 3 X3i + ui i = 1, . . . , 500 donde X2 y X3 son no estocsticas, E(ui ) = 0 i, V ar(ui ) = 2 X2i , y Cov(ui uj ) = 0 i = j. Se pide: a 1. Cmo estimar ecientemente 1 , 2 y 3 ? Describe claramente el mtodo de estimacin o as e o y escribe la forma matricial del estimador completando todos los elementos de las matrices implicadas. 2. Como contrastar la signicatividad individual de la variable X2i ? Escribe la hiptesis nula, as o la alternativa y el estad stico de contraste junto con su distribucin. o 3. Como contrastar H0 : 2 + 3 = 2? Escribe la hiptesis nula, la alternativa y el estad as o stico de contraste junto con su distribucin. o 4. Como contrastar la hiptesis compuesta H0 : 2 = 1 y 3 = 2? Escribe la hiptesis nula, as o o la alternativa y el estad stico de contraste junto con su distribucin. o
Estad sticos basados en el estimador de por MCGF. En este caso Y = X + u u N (0, ) desconocida, pero estimable consistentemente
El estimador de MCGF, M CGF = (X 1 X)1 (X 1 Y ), es un estimador no lineal y en general sesgado, cuya distribucin en muestras nitas no es conocida. En muestras grandes es un estimador o consistente si es un estimador consistente de . Su distribucin asinttica es: o o d T (M CGF ) N (0, G1 ) Los estad sticos de contraste y distribucin asociada utilizando como estimador de G1 = plim o M CGF ) = T (X 1 X)1 son, a T V ( para q = 1 RM CGF r R (X 1 X)1 R para q > 1
d,H0 (RM CGF r) [ R (X 1 X)1 R ]1 (RM CGF r) 2 q d,H0 1 TX
N (0, 1)
Las reglas de decisin son las habituales. o Estad sticos basados en el estimador de por MCO y un estimador robusto a hete rocedasticidad y/o autocorrelacin de V (M CO ) o En presencia de perturbaciones no esfricas, el estimador M e nimo Cuadrtico Ordinario es lineal, a insesgado y consistente, pero no es de varianza m nima. Su matriz de varianzas y covarianzas se dene V (M CO ) = 2 (X X)1 X X(X X)1 . Un estimador de la matriz de varianzas y covarianzas del estimador MCO es V (M CO ) = 2 (X X)1 . Utilizar este estimador para hacer inferencia cuando 35
SARRIKO-ON 04/10
Anlisis de datos a
hay heterocedasticidad y/o autocorrelacin no es adecuado. Los estad o sticos t y F habituales para hacer inferencia sobre denidos en base a este estimador de la matriz de varianzas y covarianzas de M CO son inapropiados ya que es un estimador sesgado e inconsistente. La dicultad que entraa el conocimiento de , o en su caso, hace interesante el poder contar n con un estimador de V (M CO ) consistente y robusto a la posible existencia de heterocedasticidad y/o autocorrelacin para de esta forma derivar estad o sticos vlidos, al menos asintticamente, y a o contrastar hiptesis sobre el vector de coecientes utilizando M CO . o Supongamos que V (M CO )Consistente es la estimacin consistente de V (M CO ) de la que hablamos. o Dado que el estimador MCO es consistente podemos utilizarlos conjuntamente para hacer inferencia asinttica vlida. En este caso el estad o a stico vlido para realizar contraste de hiptesis de la forma a o H0 : R = r y su distribucin asinttica asociada bajo la hiptesis nula son: o o o
d,H0 (RM CO r) (R V (M CO )Consistente R )1 (RM CO r) 2 q
Siendo q el nmero de restricciones de contraste. Para q = 1 podemos escribir el estad u stico anterior como: RM CO r R V (M CO )Consistente R
d,H0
N (0, 1)
Las reglas de decisin son las habituales. En los temas siguientes veremos que esta matriz robusta o a heterocedasticidad y/o autocorrelacin existe y puede ser calculada. o
1.6.
Ejemplo: Sistemas de Ecuaciones
En ocasiones necesitamos estimar un sistema de ecuaciones. Vamos a ver diferentes posibilidades de estimacin de un sistema como ilustracin del tema de perturbaciones no esfricas y a la vez, o o e mostraremos como realizar el contraste de cambio estructural o de Chow. Ilustraremos esta seccin utilizando uno de los ejemplos vistos al comienzo del tema. Supongamos o que queremos estimar la demanda de automviles Y como una funcin de la renta X, utilizando o o datos microeconmicos sobre gastos de las familias en dos ncleos geogrcos distintos, ncleo o u a u urbano y ncleo rural. u La funcin de demanda para las familias del ncleo urbano es: o u Y1i = a1 + b1 X1i + u1i Y1 = X1 1 + u1
2 siendo u1 N (0, 1 IN1 ) i = 1, . . . , N1
La funcin de demanda para las familias del ncleo rural es: o u Y2j = a2 + b2 X2j + u2j Y2 = X2 2 + u2
2 siendo u2 N (0, 2 IN2 ) j = 1, . . . , N2
Podemos escribir el siguiente sistema de ecuaciones: Y1 Y2 = X1 0 0 X2 1 2 + 36 u1 u2 Y = X + u (1.5)
Anlisis de datos a Y
((N1 + N2 ) 1)
SARRIKO-ON 04/10 = X + u
((N1 + N2 ) 1)
((N1 + N2 ) 4) (4 1)
Suponemos que X es no estocstica. El vector de medias y la matriz de varianzas y covarianzas del a vector de perturbaciones u son: E(u)
((N1 + N2 ) 1)
E(u1 ) E(u2 ) =
0 0
E(uu )
((N1 + N2 ) (N1 + N2 ))
E(u1 u1 ) E(u1 u2 ) E(u2 u1 ) E(u2 u2 )
En el sistema de ecuaciones anterior no hay relacin entre los coecientes de las dos ecuaciones. En o cuanto a la estructura de E(uu ), podemos distinguir tres situaciones:
2 2 2 2 1. E(u1 u1 ) = 1 IN1 , E(u2 u2 ) = 2 IN2 con 1 = 2 , es decir, homocedasticidad entre ecuaciones y E(u1 u2 ) = E(u2 u1 ) = 0 lo que implica que no hay relacin entre las perturbaciones de las o dos ecuaciones. 2 2 2 2 2. E(u1 u1 ) = 1 IN1 , E(u2 u2 ) = 2 IN2 con 1 = 2 , es decir, heterocedasticidad entre ecuaciones, y E(u1 u2 ) = E(u2 u1 ) = 0.
3. Ecuaciones aparentemente no relacionadas E(u1 u2 ) = E(u2 u1 ) = 0. Dado que no existe relacin entre los coecientes de las dos ecuaciones, el mtodo ms adecuado o e a para estimar un modelo Y = X + u depende de la estructura de E(uu ).
1.6.1.
Ecuaciones no relacionadas con varianza comn u
Sean las ecuaciones: Y1 = X1 1 + u1 Y2 = X2 2 + u2 N1 obs. N2 obs.
En principio 1 y 2 son distintos, como nada relaciona a las dos ecuaciones podr amos pensar que ganamos en eciencia utilizando toda la informacin conjuntamente y por ello deber o amos estimar 2 = 2 y E(u u ) = E(u u ) = 0 tenemos que conjuntamente el modelo. Dado que 1 1 2 2 1 2 E(uu ) =
2 1 IN1 0
0 2I 2 N2
2 IN1 0
0 2 IN2
= 2 IN1 +N2
El modelo puede ser estimado por MCO que ser lineal, insesgado y de varianza m a nima. Se puede probar que dado que no hay informacin comn entre las ecuaciones, es decir, dado que X es o u diagonal por bloques y E(u1 u2 ) = E(u2 u1 ) = 0, la estimacin del modelo conjunto por MCO es o equivalente a estimar cada ecuacin por separado por MCO. La estimacin conjunta no gana en o o eciencia, por tanto estimaremos las ecuaciones por separado por MCO. 37
SARRIKO-ON 04/10 Adems, 2 es insesgado y consistente: a 2 = uu u u1 + u2 u2 = 1 N K N K donde N = N1 + N2 y
Anlisis de datos a
K = K1 + K2
Contraste de cambio estructural o de Chow: Se llama contraste de cambio estructural al contraste de que todos o algunos de los coecientes que corresponden a las mismas variables en las dos ecuaciones son iguales. Supongamos que queremos contrastar la igualdad de ordenadas y pendientes o lo que es igual cambio estructural total: H0 : a1 = a2 y b1 = b2 Ha : a1 = a2 y/o b1 = b2 Hay dos formas alternativas de realizar el contraste: Alternativa 1: Con el estad stico: F= donde R r = 1 0 1 0 0 1 0 1 (RM CO r) R(X X)1 R 2
1
H0 : 1 = 2 q = 2 Ha : 1 = 2
(RM CO r)/q
H0
F(q, N K)
a1 b1 a2 b2
0 0
q=2
K=4
2 = Regla de decisin: o
u u1 + u2 u2 uu = 1 N K N K
Si F < F(q,N K)| no rechazamos la H0 para un nivel de signicacin y concluimos que o no existe cambio estructural. Si F > F(q,N K)| rechazamos la H0 para un nivel de signicacin y concluimos que o existe cambio estructural. Alternativa 2: Con el estad stico (r ur u u)/q H0 u F(q, N K) u u/N K donde u u es la SCR del modelo no restringido (1.5) tal que u u = u1 u1 + u2 u2 y ur ur es la SCR del modelo restringido siguiente: Y1 Y2 = X1 X2 + u1 u2 (1.6)
Dado que hemos supuesto que E(uu ) = 2 IN1 +N2 el modelo restringido se estima por MCO. Esta estimacin no es equivalentemente a estimar por MCO ecuacin por ecuacin, ya que su o o o matriz de regresores no es diagonal por bloques. 38
Anlisis de datos a
SARRIKO-ON 04/10
1.6.2.
Ecuaciones no relacionadas con varianzas distintas
Sean las ecuaciones: Y1 = X1 1 + u1 Y2 = X2 2 + u2 N1 obs. N2 obs.
2 2 Dado que 1 = 2 y E(u1 u2 ) = E(u2 u1 ) = 0 tenemos que
E(uu ) =
2 1 IN1 0
0
2 2 IN2
= (N1 +N2 )(N1 +N2 )
2 2 Suponiendo 1 y 2 conocidas, el modelo debiera ser estimado por MCG. Sin embargo, este procedimiento coincide con estimar por MCO ecuacin por ecuacin, ya que no existe relacin entre los o o o coecientes de ambas ecuaciones, X es diagonal por bloques, E(uu ) tambin lo es y hay homocee dasticidad dentro de cada ecuacin. o
M CG = (X 1 X)1 X 1 Y =
(X1 X1 )1 X1 Y1 (X2 X2 )1 X2 Y2
1 2
M CO
V (M CG ) = (X 1 X)1 =
2 1 (X1 X1 )1 0 2 0 2 (X2 X2 )1
En este caso la estimacin del modelo conjunto por MCG no mejora la eciencia con respecto a o estimar cada ecuacin por separado por MCO, por tanto estimaremos las ecuaciones por separado. o 2 2 Adems, el resultado de estimar es independiente de que conozcamos o no 1 y 2 . a Contraste de cambio estructural o de Chow: H0 : a1 = a2 y b1 = b2 Ha : a1 = a2 y/o b1 = b2 H0 : 1 = 2 q = 2 Ha : 1 = 2
Una forma de realizar el contraste es utilizar el estad stico: (RM CG r) R(X 1 X)1 R donde R r = 1 0 1 0 0 1 0 1
1
0 (RM CG r) 2 q
a1 b1 a2 b2
0 0
q=2
K=4
con la regla de decisin habitual. o

2 2 Si 1 y 2 son desconocidas es necesario estimarlas. El estimador de los coecientes en el modelo conjunto ser el de MCGF tal que: a
M CGF = (X 1 X)1 X 1 Y 39
SARRIKO-ON 04/10
2 2 2 Estimar implica estimar 1 y 2 ; un estimador consistente de i
Anlisis de datos a i = 1, 2 ser a:
1 = 2
u1 u1 N1 u2 u2 N2
u1 u1 = Y1 Y1 1,M CO X1 Y1
u1 = Y1 X1 1,M CO
2 = 2
u2 u2 = Y2 Y2 2,M CO X2 Y2
u2 = Y2 X2 2,M CO
Notar que en cada ecuacin por separado hay homocedasticidad y no autocorrelacin. o o
1.6.3.
Ecuaciones aparentemente no relacionadas
Si un conjunto de ecuaciones se relacionan unicamente por los trminos de perturbacin reciben el e o nombre de Ecuaciones Aparentemente no Relacionadas. Sea el sistema de ecuaciones Y1 = X1 1 + u1 Y2 = X2 2 + u2 N obs N obs
Un supuesto sencillo acerca de la estructura de la matriz de varianzas y covarianzas ser a:

2 E(u1 u1 ) = 1 IN ecuacin. o 2 E(u2 u2 ) = 2 IN , homocedasticidad y no autocorrelacin dentro de cada o
E(u1 u2 ) = E(u2 u1 ) = 12 IN , correlacin contempornea entre las perturbaciones de las o a ecuaciones.
E(uu ) =
2 1 IN 12 IN
12 IN 2 2 IN
= 2N 2N
2 2 En este caso ganamos en eciencia si estimamos el modelo conjunto (1.5). Si 1 , 2 , 12 son conocidas estimaremos por MCG. Si son desconocidas el modelo conjunto debiera estimarse por MCGF. Podemos encontrar estimadores consistentes de estos parmetros utilizando los residuos MCO de a estimar cada ecuacin por separado: o
u1 u1 N u2 u2 2 2 = N u1 u2 12 = N 1 = 2
u1 u1 = Y1 Y1 1,M CO X1 Y1 u2 u2 = Y2 Y2 2,M CO X2 Y2
u1 = Y1 X1 1 u2 = Y2 X2 2
40
Anlisis de datos a
SARRIKO-ON 04/10
1.7.
Ejercicios a resolver
Adems, de los ejercicios que se resuelven en clase tenis a vuestra disposicin una coleccin de a e o o ejercicios de examen que se actualiza cada ao. No deber dar por acabado el trabajo de cada n ais tema hasta que estn hechos los ejercicios recomendados en clase. a Ejercicio M-MCG.1: Sea el modelo Yt = + Xt + ut
donde
2 E(u2 ) = tXt t
1. Conociendo cinco observaciones de Yt y Xt obtn por MCO y en forma matricial, las estimae ciones de y del modelo anterior. t Yt Xt 2. Ahora adems, se conoce: a E(u1 u3 ) = E(u3 u1 ) = 1 y E(u1 u2 ) = E(u2 u1 ) = E(u2 u3 ) = E(u3 u2 ) = 0 E(u1 u4 ) = E(u4 u1 ) = 1 y E(u1 u5 ) = E(u5 u1 ) = E(u2 u5 ) = E(u5 u2 ) = 0 E(u3 u5 ) = E(u5 u3 ) = 1 y E(u3 u4 ) = E(u4 u3 ) = E(u4 u5 ) = E(u5 u4 ) = 0 E(u2 u4 ) = E(u4 u2 ) = 1 Dadas las observaciones de Yt e Xt y la informacin sobre E(ut us ), calcula la matriz de o varianzas y covarianzas del estimador MCO. 3. Dada la informacin anterior, qu propiedades tiene el estimador M o e nimo Cuadrtico Ordia nario? 4. Conoces un estimador con mejores propiedades? Cul es? Qu propiedades tiene? Escribe a e su matriz de varianzas y covarianzas. No la estimes, escribe solo su frmula y explica que son o cada uno de sus elementos. 1 1 1 2 1 -1 3 0 1 4 -1 1 5 -1 1
Ejercicio M-MCG.2: Considera el siguiente modelo de regresin general: o Yt = 1 + 2 X2t + 3 X3t + ut t = 1, . . . , 500
2 2 donde X2 y X3 son no estocsticas y ut N ID (0, t ) con t = 2 t2 . a
1. Escribe E(u) y E(uu ). 2. Obtn la matriz de varianzas y covarianzas de Y . e 41
SARRIKO-ON 04/10
Anlisis de datos a
3. Se ha estimado el modelo por M nimos Cuadrados Generalizados, obtenindose las siguientes e estimaciones: 1 3 1 0 6 2 M CG = 3 V (M CG ) = 1 1 0 2 2 Realiza los contrastes de las siguientes hiptesis: o a) 1 = 0 b) 2 + 23 = 1 c) 1 = 0 y 2 + 23 = 1
Ejercicio M-MCG.3: En el modelo Yt = +Xt +ut tal que:

2 t = 1, . . . , 4 se cumple E(u2 ) = tXt t
y E(ut us ) = 0 t, s
t = s,
t Yt Xt
1 2 1
2 1 -1
3 -1 0
4 -3 1
1. Escribe la matriz de varianzas y covarianzas de la perturbacin E(uu ). o 2. Escribe el modelo transformado con perturbaciones esfricas y demuestra que sus perturbae ciones tienen varianza constante. 3. En el modelo transformado, escribe la matriz de regresores y el vector de valores de la variable endgena. o 4. Estima, utilizando clculo matricial, los parmetros del modelo transformado. a a
42
Anlisis de datos a
SARRIKO-ON 04/10
1.8.
Bibliograf del tema a
Referencias Bibliogrcas Bsicas: a a Terica: o [1] Greene, W. (1998), Anlisis Economtrico, ed. Prentice Hall, 3a edition. a e [2] Ramanathan, R. (2002), Introductory Econometrics with applications, ed. South-Western, 5th edition. [3] Wooldridge, J. M. (2003), Introductory Econometrics: A modern Approach, ed. South-Western, 2nd edition. Ejercicios: [1] Fernndez, A., Gonzlez, P., Reglez, M., Moral, P., Esteban, V. (2005), Ejercicios de Econoa a u a edicin. metr ed. McGraw-Hill, 2 a, o [2] Recopilacin de ejercicios recomendados y exmenes de Econometr Departamento de Econom o a a. a Aplicada III (Econometr y Estad a stica). Mimeo Febrero 2009. Ejercicios con gretl: [1] Ramanathan, R. (2002), Instructors Manual to accompany, del libro Introductory Econometrics with applications, ed. South-Western, 5th edition, Harcourt College Publishers. [2] Wooldridge, J. M. (2003), Student Solutions Manual, del libro Introductory Econometrics: A modern Approach, ed. South-Western, 2nd edition. Referencias Bibliogrcas Complementarias: a Terica: o [1] Alonso, A., Fernndez, J. y Gallastegui, I. (2005), Econometr ed. Pearson: Prentice Hall. a a, [2] Gujarati, D. (2004), Econometr ed. McGraw-Hill, 4a edicin. a, o [3] Johnston, J. (1984), Mtodos de Econometr ed. Vicens Vivens, 4a edicin. e a, o [4] Maddala, G. S. (1996), Introduccin a la Econometr ed. Pearson: Prentice Hall. o a, [5] Novales, A. (1993), Econometr ed. McGraw-Hill, 2a edicin. a, o
43
SARRIKO-ON 04/10
Anlisis de datos a
44
Tema 2
Heterocedasticidad
Clases Magistrales
En las clases magistrales del tema de heterocedasticidad vamos a abordar uno de los problemas mencionados en el tema anterior: cmo estimar ecientemente los coecientes desconocidos de un o modelo cuando la varianza de la perturbacin no es constante y cmo realizar inferencia de forma o o adecuada. En el tema anterior se han mostrado las consecuencias en el estimador de M nimos Cuadrados Ordinarios, MCO, de no tener perturbaciones esfricas y cmo estimar por M e o nimos Cuadrados Generalizados, MCG, obteniendo estimadores ecientes de los coecientes desconocidos. Por ello los instrumentos ya se conocen. En este tema vamos a concentrarnos en mostrar situaciones en las que la varianza de la perturbacin no es constante y trabajar de forma prctica con diferentes supuestos o a sobre el comportamiento de la varianza de la perturbacin. o Si bien buena parte del instrumental de estimacin y contraste no es nuevo, si que lo sern los o a estad sticos de contraste para la hiptesis de homocedasticidad. Junto con el anlisis grco de los o a a residuos m nimo-cuadrticos se mostraran dos estad a sticos de contraste, el contraste de Goldfeld y Quandt y el contraste de Breusch y Pagan. Tambin se mostrar como utilizar el estimador de e a M nimos Cuadrados Generalizados Factibles, MCGF, bajo el supuesto de varianza no constante, desconocida y estimable. Finalmente, se aprender a obtener un estimador consistente de la matriz a de varianzas y covarianzas del estimador MCO. En el tema de heterocedasticidad habitualmente se dispone de siete clases magistrales de las cuales, aproximadamente, tres horas se dedican a resolver ejercicios. Adems, se resolvern las dudas a a surgidas y se realizaran preguntas al alumno sobre los contenidos vistos, en muchas ocasiones en forma de preguntas cortas que se recogen y evalan convenientemente. u
Competencias a trabajar en estas sesiones: 1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 45
SARRIKO-ON 04/10
Anlisis de datos a
2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e Al nal de este tema deber ais ser capaces de: 1. Explicar que se entiende por un modelo de regresin lineal con heterocedasticidad, cmo o o modelizar esta caracter stica en el trmino de perturbacin del modelo y sus implicaciones en e o su matriz de varianzas y covarianzas. 2. Saber analizar grcamente la posible existencia de heterocedasticidad y saber contrastarla a utilizando los estad sticos de Goldfeld-Quandt y/o Breusch-Pagan. 3. Describir y comparar las propiedades de los estimadores MCO y MCG bajo heterocedasticidad. 4. Transformar un modelo con perturbacin heterocedstica en un modelo con perturbacin o a o homocedstica. a 5. Estimar por MCG o MCGF segn la especicacin de la varianza de la perturbacin del u o o modelo. 6. Razonar por qu resulta conveniente disponer de un estimador consistente de la matriz de vae rianzas y covarianzas de los estimadores de MCO en presencia de heterocedasticidad. Conocer, saber obtener y utilizar dicho estimador en el contexto adecuado.
Bibliograf Recomendada: a Al nal del tema tenis recogida la bibliograf correspondiente. En particular os recomendamos e a leer los cap tulos correspondientes a la bibliograf bsica detallados a continuacin: a a o Greene, W. (1998), cap. 12. Ramanathan, R. (2002), cap. 8. Wooldridge, J. M. (2003), cap. 8. Y para profundizar, podis leer los cap e tulos detallados a continuacin correspondientes a la biblioo graf complementaria: a Alonso, A. et al. (2005), cap. 9. Gujarati, D. (2004), cap. 11. Johnston, J. (1984), cap. 7. Maddala, G. S. (1996), cap. 5. Novales, A. (1993), cap. 5, cap. 6.
46
Anlisis de datos a
SARRIKO-ON 04/10
2.1.
Concepto de heterocedasticidad. Naturaleza y consecuencias. Ejemplos
Se dice que la varianza del trmino de perturbacin del modelo de regresin lineal es heterocedstica e o o a cuando no es constante para todas las observaciones. En este tema nuestro marco de trabajo queda denido como sigue: Yi = 1 + 2 X2i + 3 X3i + . . . + K XKi + ui i = 1, 2, . . . , N Yi = Xi + ui
a donde los regresores contenidos en la matriz Xi = [ 1 X2i . . . XKi ] son no estocsticos y las perturbaciones tienen media cero, varianza no constante y covarianzas cero: E(ui ) = 0 i 2 E(u2 ) = i i = 1, 2, . . . , N i E(ui uj ) = 0 i, j i = j En trminos matriciales el modelo se escribe: e Y
(N 1)
u
(N 1)
(N K) (K1)
y la estructura de la matriz de varianzas y covarianzas del vector de perturbaciones ser a la siguiente: E(uu ) = (N N )
2 1 0 0 2 0 2 0 2 0 0 3 . . . . . . . . . 0 0 0
... ... ... .. .
0 0 0 . . .
= 2
2 . . . N
w11 0 0 0 w22 0 0 0 w33 . . . . . . . . . 0 0 0
... ... ... .. .
0 0 0 . . .
. . . wN N
2 donde V ar(ui ) = i puede cambiar para cada individuo y suponemos que no existe correlacin o entre perturbaciones de distintos individuos, E(ui uj ) = 0 i, j i = j. Es decir, slo consideramos o la existencia de heterocedasticidad. Esta matriz es una matriz diagonal de dimensin (N N ) donde o los elementos de la diagonal no son todos iguales. El parmetro 2 es un factor de escala comn a a u todos los elementos de la matriz, que perfectamente puede tomar el valor de la unidad.
Para diferenciar entre el concepto de homocedasticidad y el concepto de heterocedasticidad podemos considerar la Figura 2.1. En la izquierda se puede observar que la varianza condicional de Yi a las Xi permanece igual sin importar los valores que tome la variable X. Hay que recordar que la varianza condicional de Yi es la misma que la de ui , por tanto, en el grco estamos observando a como la varianza de la perturbacin permanece constante independientemente del valor que tome el o regresor. En la derecha se muestra que la varianza de Yi aumenta a medida que X aumenta1 . Hay heterocedasticidad, y lo denotamos:
2 V ar(ui ) = E(u2 ) = i . i
1 En este caso la varianza de ui se relaciona con Xi y lo hace de forma creciente, pero podr ser funcin de otra u a o otras variables que no sean regresores del modelo. La forma funcional tambin puede ser diferente. e
47
SARRIKO-ON 04/10
Anlisis de datos a
Figura 2.1: Perturbaciones homocedsticas versus heterocedsticas a a

) u ( f ) u ( f
Homocedsticas a
Heterocedsticas a
La existencia de heterocedasticidad puede aparecer en numerosas aplicaciones econmicas sin emo bargo, es ms habitual en datos de seccin cruzada. A continuacin veremos algunas situaciones en a o o las cuales las varianzas de ui pueden no ser constantes. En datos de seccin cruzada. o Ejemplo 2.1 Supongamos que tenemos datos para diferentes comunidades autnomas eso paolas en el ao 2005 sobre gasto sanitario agregado, GS, renta personal disponible, R, el n n porcentaje de poblacin que supera los 65 aos, SEN y poblacin, P OP , con los que estimar o n o el siguiente modelo: GSi = 1 + 2 Ri + 3 SENi + 4 P OPi + ui i = 1, . . . , N (2.1)
Las comunidades con ms poblacin y/o mayor porcentaje de poblacin con edad superior a o o a 65 aos tendrn mayor gasto sanitario que aquellas con menor poblacin o ms joven. n a o a En esta situacin suponer que la dispersin de los gastos sanitarios es la misma para todas o o las comunidades con distinto nivel de poblacin y composicin de la misma no es realista, o o y se deber proponer que la varianza de la perturbacin sea heterocedstica V ar(ui ) = a o a 2 , permitiendo por ejemplo que var en funcin creciente con la poblacin, es decir, 2 = i e o o i 2 P OPi . Incluso podemos pensar que var en funcin creciente con el porcentaje de poblacin e o o 2 SEN o con ambas variables, mayor de 65 aos, en cuyo caso propondr n amos V ar(ui ) = i por lo que la forma funcional pudiera ser V ar(ui ) = 2 (a P OPi + b SENi ). Ejemplo 2.2 Un ejemplo recurrente para mostrar la heterocedasticidad es el estudio de la relacin entre consumo y renta. Este ejemplo se va a seguir detalladamente a lo largo del tema o utilizndolo como ejemplo magistral. Ser completamente descrito en la siguiente seccin, pero a a o reexionemos un momento sobre l. Supongamos que tenemos datos sobre renta, R, y gasto e en consumo, C, para N familias, con los que estimar el modelo: Ci = 1 + 2 Ri + ui 48 i = 1, . . . , N (2.2)
+
2 X
Y Y X 6 X 1 X
Anlisis de datos a
SARRIKO-ON 04/10
Las familias con mayor renta, una vez satisfechas sus necesidades primordiales tienen mayores posibilidades de decidir cunto ahorrar y cunto consumir, por lo que es habitual encontrar a a una mayor variabilidad en el gasto realizado por familias de renta alta que por familias de renta baja. En esta situacin suponer que la dispersin de los gastos de consumo es la misma o o para todas las familias con distinto nivel de renta no es realista y se deber proponer que la a 2 , permitiendo por ejemplo que varianza de la perturbacin sea heterocedstica V ar(ui ) = i o a 2 var en funcin creciente con la renta de las familias, es decir, i = 2 Ri . e o o e Ejemplo 2.3 Un fenmeno parecido ocurre con las empresas que deben decidir qu porcentaje de sus benecios, B, deben repartir como dividendos, D. Las empresas con mayores benecios tienen un margen de decisin muy superior al jar su pol o tica de dividendos. Al estimar el modelo: Di = 1 + 2 Bi + ui i = 1, . . . , N (2.3)
cabr esperar que la varianza de ui dependa del nivel de benecios de la empresa i-sima y a e 2 podr amos proponer que por ejemplo, E(u2 ) = i = 2 Bi . i La heterocedasticidad tambin puede aparecer como consecuencia de la agregacin de e o datos. En este caso la varianza puede depender del nmero de observaciones del grupo. u Ejemplo 2.4 modelo: Supongamos un investigador que desea estimar los coecientes del siguiente
Yj = 1 + 2 Xj + uj
j = 1, . . . , N
(2.4)
donde uj N (0, 2 ), es decir, la varianza de la perturbacin es homocedstica. Supongamos o a que el nmero de observaciones N es tal que aconseja agrupar las observaciones en m-grupos u de ni observaciones cada uno. Supongamos que como observacin del grupo i-simo se toma o e la media aritmtica dentro del grupo. El modelo a estimar ser e a: Yi = 1 + 2 Xi + ui i = 1, . . . , m (2.5)
y la nueva perturbacin ui seguir teniendo media cero, pero su varianza no ser constante o a a ya que depender del nmero de observaciones dentro del grupo, a u V ar(i ) = u 2 ni i = 1, . . . , m.
Si el nmero de observaciones dentro del grupo es el mismo en todos los grupos la varianza u de la perturbacin ui es homocedstica. o a Tambin encontraremos heterocedasticidad en un modelo con coecientes aleatorios en e el cual se permite cierta heterogeneidad entre individuos en los efectos de una variable explicativa.
49
SARRIKO-ON 04/10 Ejemplo 2.5 Sea el modelo: Yi = 1 + 2 X2i + 3i X3i + ui donde: - las variables exgenas X2i y X3i son no estocsticas. o a
2 - ui iid(0, u )
Anlisis de datos a
i = 1, . . . , N
(2.6)
- 3i = + i siendo una constante a estimar. La variable aleatoria i recoge la heterogeneidad tal que, aunque en media el efecto es comn a todos los individuos, recogido en u 2. , hay cierta variabilidad recogida por i
iid(0, 2 )
Cov(ui , i ) = 0
En este caso la ecuacin a estimar ser o a: Yi = 1 + 2 X2i + X3i + vi donde vi = ui + i X3i con distribucin: o
2 2 vi (0, u + X3i 2 )
i = 1, . . . , N
(2.7)
y vemos que la varianza del trmino de perturbacin del modelo a estimar no es constante ya e o que depende de la variable exgena X3i que var con i. o a Otro caso ser la existencia de un cambio estructural en varianza recogido por una a variable cticia en la varianza de la perturbacin. o Ejemplo 2.6 Supongamos que se desea estudiar la relacin entre produccin, Y , y mano de o o obra, X, para un conjunto de 20 trabajadores de los cuales 10 son mujeres y el resto hombres. Si suponemos que la variabilidad de la produccin es distinta para los hombres que para las o mujeres nuestro modelo a estimar ser a: Yi = 1 + 2 Xi + ui i = 1, . . . , 20 (2.8)
donde ui (0, 1 + 2 Di ) siendo Di una variable cticia que toma valor la unidad si la observacin corresponde a una mujer y cero en el caso contrario. En este caso: o V ar(ui ) = 1 + 2 V ar(ui ) = 1 para las observaciones correspondientes a las mujeres para las observaciones correspondientes a los hombres
Suponiendo que las primeras diez observaciones corresponden a mujeres, la matriz de varianzas y covarianzas del vector de perturbaciones ser la siguiente: a E(uu ) = (1 + 2 )I10 0 0 1 I10 50
Anlisis de datos a
SARRIKO-ON 04/10
Antes de pasar a abordar el problema de hereterocedasticidad ms en detalle vamos a recordar a cules son las consecuencias de la heterocedasticidad sobre el estimador de MCO y su matriz de a varianzas y covarianzas: Si u N (0, 2 ) entonces: M CO N (, 2 (X X)1 X X(X X)1 ) el estimador MCO ser lineal e insesgado, pero no ser de varianza m a a nima si = I. En el caso de un modelo con perturbaciones heterocedsticas la variabilidad de las observaa ciones de la variable endgena dada la exgena no es la misma para todas las observaciones. o o El criterio MCO prescinde de esta informacin ya que concede a todas las observaciones el o mismo peso. En estas circunstancias parecer ms adecuado ponderar ms las realizaciones muestrales que a a a sistemticamente se desv menos del valor promedio de la variable endgena, que es sobre a an o lo que queremos inferir. Es decir, desear amos dar mayor peso a aquellas observaciones que surgen de poblaciones con menor variabilidad que a aquellas que provienen de poblaciones con mayor variabilidad. Debemos estimar por MCG (cuando es conocida). El criterio de estimacin M o nimo Cuadrtico Generalizado que estudibamos en el tema anterior es: a a M in (Y X ) 1 (Y X ) El estimador de MCG que se obtiene de la funcin objetivo anterior se dene como: o M CG = (X 1 X)1 (X 1 Y ) El estimador MCG es lineal, insesgado y de varianza m nima. Su matriz de varianzas y covarianzas es: V (M CG ) = 2 (X 1 X)1 Si 2 es desconocida, que es lo habitual, la estimamos con la expresin 2 = o M CG . u = Y X
u 1 u N K
siendo
2 a Ejemplo 2.7 Para el modelo Yi = Xi +ui siendo X una variable no estocstica y ui N ID(0, i ). El criterio MCG (o funcin objetivo) se escribir o a: N
M in de donde M CG =
N i=1
i=1 1
1 2 2 (Yi Xi ) i
N i=1
1 2 Xi Xi i
1 2 Xi Yi = i
N 1 2 i=1 i Xi Yi N 1 2 i=1 i Xi Xi
51
SARRIKO-ON 04/10
Anlisis de datos a
En la prctica, generalmente no sabemos de antemano si hay o no problemas de heterocedasticidad a en las perturbaciones, por lo que se ha desarrollado un gran nmero de procedimientos para conu trastar la hiptesis nula de igualdad de varianzas u homocedasticidad. Esta gran variedad se debe a o que la especicacin de la hiptesis alternativa de heterocedasticidad no suele ser conocida y puede o o ser ms o menos general. En la siguiente seccin vamos a abordar algunos de estos contrastes. a o
2.2.
Contrastes de heterocedasticidad
Nuestro objetivo es claro: Detectar la existencia de heterocedasticidad en las perturbaciones de un modelo. La primera aproximacin al objetivo es el estudio de los grcos de residuos o a y de las variables del modelo.
2.2.1.
Deteccin grca. o a
La aplicacin del estimador de MCG y algunos contrastes de heterocedasticidad requieren conocer o la forma funcional de la varianza de la perturbacin. Si suponemos que la varianza de la perturbao cin depende de uno o ms regresores, u otras variables conocidas, un instrumento adecuado para o a aproximarnos a la misma ser llevar a cabo un anlisis de los residuos MCO donde no hemos tenido a a en cuenta la existencia de heterocedasticidad. Aunque uM CO,i no es lo mismo que ui la deteccin o de patrones sistemticos en la variabilidad de los residuos MCO nos indicar la posible existencia a a de heterocedasticidad en las perturbaciones. Adems, puede indicarnos una posible forma funcional a de la misma. Consideramos el modelo (2.1) recogido en el Ejemplo 2.1: GSi = 1 + 2 Ri + 3 SENi + 4 P OPi + ui i = 1, . . . , N
donde suponemos E(ui ) = 0 i y E(ui uj ) = 0 i, j i = j. Si sospechamos que ui es heterocedstica debido a la variable P OP , podemos intentar detectar la existencia de heterocedasticidad a en las perturbaciones del modelo ayudndonos del grco de los residuos MCO, (M CO,i ), frente a a a u la variable P OPi . Si el grco es como el recogido en la Figura 2.2 pensaremos que la variabilidad de los residuos a uM CO,i se incrementan con P OPi y que el incremento es directamente proporcional. As podr , amos proponer, por ejemplo: E(u2 ) = 2 P OPi i = 1, 2, . . . , N i Si el grco de los residuos MCO frente a P OP hubiera sido como el recogido en la Figura 2.3 a supondr amos que el aumento en la varianza de ui es inversamente proporcional a P OPi y propondr amos: E(u2 ) = 2 P OPi1 i = 1, 2, . . . , N i Tambin podemos optar por dibujar la serie de los residuos al cuadrados MCO frente a la variable e que creemos causa la heterocedasticidad como se muestra en la Figura 2.4. En el grco de la a izquierda se muestran los pares (SENi , uM CO,i ), en el grco de la derecha se muestran los pares a 52
Anlisis de datos a
SARRIKO-ON 04/10
Figura 2.2: Residuos MCO versus P OP

Residuos de la regresin (= GS observada estimada) 5 4 3 2 residuos MCO 1 0 1 2 3 4 0 5 10 15 POP 20 25 30
Figura 2.3: Residuos MCO versus P OP

5 4
2 residuos MCO
-1
-2
-3
-4 0 0.5 1 POP 1.5 2
(SENi , u2 CO,i ). Ambos grcos muestran la misma informacin, muestran que la variabilidad de los M a o residuos se incrementa con SEN y podr amos proponer, por ejemplo V ar(ui ) = E(u2 ) = 2 SENi . i En general a priori no se conocer cul de las variables exgenas genera la heterocedasticidad por a a o lo que resulta aconsejable estudiar los grcos de los residuos de MCO, contraponindolos a cada a e una de las variables exgenas del modelo, como estamos haciendo al estudiar los residuos frente a o P OPi y frente a SENi . Notar que ambas variables parecen afectar a la varianza de la perturbacin, o por ello estar justicado proponer V ar(ui ) = (a P OPi + b SENi ), donde a y b son desconocidos y a el factor de escala es la unidad, 2 = 1. 53
SARRIKO-ON 04/10
Anlisis de datos a
Figura 2.4: Residuos MCO y sus cuadrados versus SEN

Residuos de la regresin (= GS observada estimada) 5 18 4 16 Cuadrado de los Residuos MCO 6 8 10 SEN 12 14 16 18 3 2 residuos MCO 1 0 1 2 3 4 14 12 10 8 6 4 2 0 6 8 10 SEN 12 14 16 18 20
Figura 2.5: Perturbaciones homocedsticas a

2 1.5
0.5 Residuos MCO
-0.5
-1
-1.5
-2
-2.5 0 5 10 15 POP 20 25 30
Si la grca entre uM CO,i y P OPi hubiera resultado como la de la Figura 2.5, concluir a amos que la varianza de la perturbacin no depende de P OPi ya que no se aprecia ningn patrn de como u o portamiento y parece que hay una distribucin aleatoria de los pares (P OPi , ui ). En esta situacin o o procede analizar los residuos frente al resto de regresores del modelo. Las formas anteriores no son las unicas. Si recordamos, en el Ejemplo 3.6 se supon una situacin a o donde hombres y mujeres en una empresa ten diferente productividad y se supon que V ar(ui ) = an a 1 + 2 Di siendo Di una variable cticia que toma valor uno si la observacin corresponde a una o mujer y cero en caso contrario. En esta situacin esperar o amos un grco como el recogido en la a Figura 2.6 donde claramente la dispersin de los residuos para las mujeres es mucho mayor que para o los hombres. Como conclusin diremos que al analizar los grcos de la relacin residuos MCO, o sus cuadrao a o dos, con cada uno de los regresores lo que intentaremos detectar visualmente es un crecimiento o 54
Anlisis de datos a
SARRIKO-ON 04/10
Figura 2.6: Residuos MCO frente a una variable cticia

800
600
400
200 Residuos MCO
-200
-400
-600
-800 0 D_i 1
decrecimiento en la variabilidad de los residuos con respecto a la variable en cuestin. o
Ejemplo a seguir en las clases magistrales del resto del tema: En lo que sigue del tema resulta muy interesante disponer de un ejercicio sobre el que ir trabajando y viendo resultados, y sobre todo para que podis replicar los mismos. Por ello os proponemos realizar a un estudio sobre la relacin entre Consumo, C, y Renta, R, para 40 familias. En la plataforma de o apoyo a la docencia, eKASI, tenis disponible un archivo llamado ejemHETERO.gdt que contiene e las observaciones de consumo y renta del ejercicio para que podis replicarlo por vuestra cuenta. a En el Anexo 1.1 que se encuentra al nal de este tema podis encontrar los resultados de gretl que e se van mostrando. Objetivo: Analizar el comportamiento de la varianza de la perturbacin en un anlisis de la relacin o a o entre consumo y renta. Datos: Observaciones sobre gasto semanal en alimentos y renta semanal para 40 familias. Ambos medidos en dlares. Se muestran en la Tabla A.3 recogida en el Apndice2 . Modelo a estimar: o e Ci = 1 + 2 Ri + ui donde: E(ui ) = 0 i, E(ui uj ) = 0 i, j i=j y se cumplen el resto de hiptesis bsicas. Nos preguntamos: Es constante la varianza de la o a perturbacin? o
2 Con la tabla tambin tenis suciente informacin para introducir vosotros mismos los datos en gretl. El procee e o dimiento aparece descrito en el Anexo 1.2 en el que se muestran instrucciones bsicas de gretl. a
i = 1, 2, . . . , 40
55
SARRIKO-ON 04/10
Anlisis de datos a
Lo primero que vamos a hacer es estimar el modelo propuesto por MCO y analizar el grco de la a relacin entre consumo y renta, Figura 2.7. Los resultados de la regresin son los siguientes3 : o o Estimaciones MCO utilizando las 40 observaciones 140 Variable dependiente: consumo Coeciente Desv. t pica estad stico t valor p const renta 40,7676 0,1282 22,1387 0,0305 1,8415 4,2008 54311,3 37,8054 0,3171 0,2991 0,0734 0,0002
Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o 2 R R2 corregido
Figura 2.7: Consumo versus Renta

consumo con respecto a renta (con ajuste mnimocuadrtico) 300 Y = 40,8 + 0,128X
250
200 consumo 150 100 50 300 400 500 600 700 renta 800 900 1000 1100
En la Figura 2.7 se muestra el grco de las observaciones de la variable Consumo, C, sobre la a variable explicativa Renta, R, junto con la recta de ajuste m nimo-cuadrtico. El grco muestra a a que existe una relacin lineal y positiva entre consumo y renta. A mayor renta mayor consumo. o Adems, se puede observar como no solo que las familias con mayor renta tienen un consumo en a media mayor que las de menor renta, sino que adems, las familias de rentas altas tienen una mayor a variacin en su consumo relativamente a las familias de rentas bajas. Lo mismo podemos concluir o de los resultados de la estimacin. Aunque el ajuste no es muy bueno, ya que el R2 es bajo, si la o perturbacin fuese esfrica y normal, la renta ser una variable signicativa al 5 % para explicar el o e a consumo. La Figura 2.8 muestra los pares (Ri , ui,M CO ). El grco permite dudar sobre el comportamiento a homocedstico de la varianza de la perturbacin ya que se puede ver claramente como a medida a o que aumenta la variable renta aumenta la dispersin en los residuos. o
3
Ver Anexo 1.1, Resultado 1.
56
Anlisis de datos a
SARRIKO-ON 04/10
Figura 2.8: Residuos MCO versus Renta

Residuos de la regresin (= consumo observada estimada) 100 80 60 40 residuos MCO 20 0 20 40 60 80 300 400 500 600 700 renta 800 900 1000 1100
La apreciacin grca de una posible existencia de heterocedasticidad debe ser refrendada mediante o a un contraste.
2.2.2.
Test de contraste para heterocedasticidad
A continuacin veremos algunos de los test de contraste para heterocedasticidad ms importantes. o a Todos ellos contrastan la existencia de heterocedasticidad suponiendo: H0 : ausencia de heterocedasticidad. Ha : existencia de heterocedasticidad.
Existe una gran variedad de test de contraste de heterocedasticidad que se diferencian entre s en su generalidad a la hora de modelizar la heterocedasticidad en la hiptesis alternativa y su potencia o para detectarla. En este curso aprenderemos dos test de contraste, el test de Goldfeld y Quandt y el test de Breusch y Pagan. El primero de ellos parte del supuesto de que la varianza de la perturbacin depende montonamente de los valores de una unica variable y es razonablemente o o potente si somos capaces de identicar bien esa variable. Por contra, el segundo supone que varianza de la perturbacin var en funcin de un conjunto de variables independientes. Cuanto mejor o a o seamos capaces de identicar la naturaleza de la heterocedasticidad mejor podremos contrastarla. Pero incluso en el caso en que no seamos capaces de identicar cual es su naturaleza podemos implementar un contraste de tipo general como es el test de White que no requiere hacer supuestos sobre la naturaleza de la misma. El test de White es un test de carcter muy general, y por lo mismo a de baja potencia, que en gretl puede ser obtenido directamente como se muestra en el Anexo 1.2. 57
SARRIKO-ON 04/10 Test de Goldfeld y Quandt (1965):
Anlisis de datos a
2 o Parte del supuesto de que la varianza de la perturbacin, i depende montonamente de los valores o de una variable Zi , que puede ser o no uno de los regresores del modelo. En cualquier caso debe ser una variable observable. Para contrastar la hiptesis nula de ausencia de heterocedasticidad: o 2 2 2 H0 : 1 = 2 = . . . = N
contra la alternativa de existencia de heterocedasticidad:

2 Ha : i = 2 g(Zi )
donde g() es una funcin montona, supongamos que creciente con Zi , podemos proceder de la o o manera siguiente: 1. Ordenar las observaciones de todas las variables del modelo en la muestra segn un ordenau miento de los valores de Zi de menor a mayor. 2. Dividir la muestra en dos bloques de tamao muestral N1 y N2 respectivamente, pudiendo n dejar fuera p observaciones centrales para hacer ms independientes los dos grupos. El nmero a u de observaciones de cada grupo ha de ser similar y mayor que el nmero de parmetros a u a estimar4 . 3. Estimar por MCO el modelo de regresin separadamente para cada grupo de observaciones. o Guardar la Suma de Cuadrados Residual (SCR) de cada regresin. o 4. Construir el siguiente estad stico de contraste, que bajo la hiptesis nula de ausencia de heo terocedasticidad y suponiendo que la perturbacin sigue una distribucin normal, de media o o cero y no est serialmente correlacionada, sigue una distribucin F-Snedecor. a o GQ = u2 u2 N1 K H0 2 2 2 = u u N K F(N2 K,N1 K) 1 1 2 1
donde: u2 u2 es la SCR de la regresin de Y sobre X en el segundo grupo de observaciones. o u1 u1 es la SCR de la regresin de Y sobre X en el primer grupo de observaciones. o Interpretacin del contraste y regla de decisin: o o Si existe homocedasticidad las varianzas han de ser iguales, pero si existe heterocedasticidad del tipo propuesto, con la ordenacin de la muestra de menor a mayor, la varianza del trmino de error o e ser mayor al nal de la muestra. Entonces u2 u2 deber ser sensiblemente mayor que u1 u1 . a a Cuanto ms diverjan las sumas de cuadrados, mayor ser el valor del estad a a stico y mayor ser la a evidencia contra la H0 , rechazaremos H0 , a un nivel de signicacin si: o GQ > F(N1 K,N2 K)| Observaciones:
4
En el caso de tener pocas observaciones, p puede ser cero.
58
Anlisis de datos a
SARRIKO-ON 04/10
Si se sospecha que la varianza del trmino de error depende inversamente de los valores que e toma una variable Zi , entonces se deber ordenar la muestra de acuerdo a un ordenamiento a de mayor a menor de los valores decrecientes de dicha variable y proceder del modo descrito anteriormente. Cmo elegir p? o Anteriormente se ha propuesto dividir la muestra en dos partes. Elegir el valor de p es relevante ya que cuanto mayor sea p ms grados de libertad se pierden y por tanto, perdemos potencia a del contraste. Si p es demasiado pequeo no habr independencia entre grupos y se prima n a la homocedasticidad frente a la posibilidad de heterocedasticidad. Harvey y Phillips (1974) sugieren jar p a 1 de la muestra. 3 El contraste se puede utilizar para detectar, en principio, heterocedasticidad de forma general, aunque est pensado para alternativas espec a cas donde se supone un crecimiento de las varianzas en funcin de una determinada variable. Si en realidad el problema no es ese, o sino que existe otra forma de heterocedasticidad, el estad stico puede no capturarla y no ser signicativo.
2 Por otro lado si no se rechaza la H0 tambin puede deberse a una mala especicacin de i , e o que quiz depende de una variable diferente a la supuesta. Por ello puede ser necesario repetir a el contraste para otras variables de las que podamos sospechar a priori.
Aplicacin del test de Goldfeld y Quandt al ejercicio propuesto. Contrastamos: o

2 2 H0 : 1 = 2 2 < 2 Ha : 1 2
Estad stico de contraste: GQ = 2 2 u2 u2 N1 K H0 2 = u u N K F(N2 K,N1 K) 1 1 2 1
donde: u2 u2 es la SCR de la regresin de C sobre R, incluyendo un trmino constante, en el segundo grupo o e de observaciones, i = 21, . . . , 40. u1 u1 es la SCR de la regresin de C sobre R, incluyendo un trmino constante, en el primer grupo o e de observaciones, i = 1, . . . , 20. En el Anexo 1.1, Resultado 2 se recogen los resultados obtenidos de gretl para resolver el contraste y que se muestran a continuacin. Los resultados de la estimacin en el primer grupo de observaciones o o son: Ci = 12, 9388 + 0, 1823 Ri (28,96) (0,52) (des(i,M CO )) SCR = 12284, 2 R2 = 0, 4052
Los resultados de la estimacin en el segundo grupo de observaciones son: o Ci = 48, 1767 + 0, 1176 Ri (70,24) (0,08) (des(i,M CO )) 59 SCR = 41146, 9 R2 = 0, 1036
SARRIKO-ON 04/10 Dada la muestra GQ =
Anlisis de datos a
41146, 9 = 3,34 12284, 2
F(18,18)|0,05 = 2,19
como 3,34 > 2,19 rechazo la H0 para = 5 % y podemos concluir que existe heterocedasticidad explicada por la variable renta. Una forma funcional razonable para la varianza de la perturbacin o ser a: V ar(ui ) = 2 Ri i = 1, 2, . . . , 40
2 o pero tambin pudieran ser otras como por ejemplo V ar(ui ) = 2 Ri tal que se recoja una relacin e creciente de la varianza de ui con la renta.
Contraste de Breusch y Pagan (1979): Breusch y Pagan en 1979 derivan un contraste de heterocedasticidad donde la hiptesis alternativa o es bastante general: H0 : E(u2 ) = 2 i ui N ID(0, 2 ) i 2 Ha : i = 2 g(0 + 1 Z1i + 2 Z2i + . . . + p Zpi ) las variables Zpi pueden o no ser variables explicativas del modelo de inters, en cualquier caso e deben ser observables y g() no se especica. Si todos los coecientes de la combinacin lineal Zi o 2 = 2 g( ). Por tanto un contraste de fuesen cero excepto 0 , la varianza ser homocedstica, i a a 0 la hiptesis nula de homocedasticidad vendr dado por la siguiente hiptesis: o a o H0 : 1 = 2 = . . . = p = 0 donde se contrastan p restricciones lineales. El proceso de contraste es el siguiente: 1. Estimar por MCO el modelo de inters obteniendo los residuos correspondientes, uM CO,i . e 2. Se obtiene la siguiente serie de residuos normalizados: e2 = i u2 CO,i M u u/N i = 1, 2, . . . , N
3. Se estima por MCO y se guarda la Suma de Cuadrados Explicada, SCE, de la siguiente regresin auxiliar: o e2 = 0 + 1 Z1i + 2 Z2i + . . . + p Zpi + i i 4. Se utiliza como estad stico de contraste el siguiente: BP = SCE d,H0 2 p 2 i = 1, 2, . . . , N
siendo p los grados de libertad, igual al nmero de variables Zpi . Rechazamos la H0 de hou mocedasticidad a un nivel de signicatividad , si el valor muestral del estad stico excede del valor cr tico esto es, BP > 2 . p| 60
Anlisis de datos a
SARRIKO-ON 04/10
Interpretacin del contraste y regla de decisin: si las perturbaciones fuesen homocedsticas, las o o a variables Zpi no deber tener poder explicativo acerca de los residuos transformados y por tanto la an SCE deber ser pequea. Si SCE/2 es grande, rechazaremos la H0 y existir heterocedasticidad. a n a Aplicacin del test Breusch y Pagan al ejercicio propuesto. Contrastamos: o H0 : E(u2 ) = 2 i i 2 Ha : i = 2 g(0 + 1 Ri ) En este caso la regresin auxiliar es: o e2 = 0 + 1 Ri + i i i = 1, . . . , 40
En el Anexo 1.1, Resultado 3 se recogen los resultados obtenidos de gretl para resolver el contraste y que se muestran a continuacin. Los resultados de la estimacin por MCO de la regresin auxiliar o o o son: ei = 1, 6788 + 0, 0038 Ri i,M CO )) (0,6876) (0,0009) (des( El valor muestral del estad stico de contraste es: SCE = 11,28 2 2 1|0,05 = 3,84
2
SCR = 52, 3940 R2 = 0, 3010
como 11,28 > 3,84, rechazo la H0 para = 5 % y podemos concluir que existe heterocedasticidad.
2.3.
El estimador MCG bajo heterocedasticidad. M nimos Cuadrados Ponderados
Una vez detectada estad sticamente la existencia de heterocedasticidad debemos abordar la estimacin del modelo teniendo en cuenta esta informacin. Una posibilidad es obtener el estimador de o o M nimos Cuadrados Generalizados, MCG, que tiene en cuenta la estructura existente en la matriz de varianzas y covarianzas. Sin embargo, implica conocer o proponer una forma funcional para la varianza de la perturbacin en cada i. Si la estructura de la matriz de varianzas y covarianzas se o conoce al menos excepto por un factor de escala, E(uu ) = 2 , y es conocida, el vector de coecientes se puede estimar por MCG resolviendo el siguiente problema de minimizacin: o M in (Y X ) 1 (Y X ) = M in
N i=1
1 2 2 (Yi Xi ) i
a resultas del cual podemos denir el estimador de MCG como: M CG = (X 1 X)1 X 1 Y 61
SARRIKO-ON 04/10 Veamos una aplicacin del procedimiento: o En el ejemplo que estamos desarrollando el modelo a estimar es el siguiente: Ci = 1 + 2 Ri + ui i = 1, 2, . . . , 40
Anlisis de datos a
(2.9)
donde E(ui ) = 0 i, E(ui uj ) = 0 i, j i = j y hemos concluido que un supuesto razonable para el comportamiento de la varianza de la perturbacin es: o V ar(ui ) = 2 Ri i = 1, 2, . . . , 40
La estructura de la matriz de varianzas y covarianzas del vector de perturbaciones es la siguiente: E(uu ) = 2 R1 0 0 . . . 0 0 R2 0 . . . 0 . . . . . . . ... . . . . . 0 0 0 . . . R40 = 2
luego es conocida. Si queremos obtener estimadores lineales, insesgados y de varianza m nima estimaremos por MCG. El vector de coecientes se puede estimar por MCG resolviendo el siguiente problema de minimizacin: o
N
M in
i=1
1 2 M in 2 (Ci 1 2 Ri ) = i
N i=1
1 (Ci 1 2 Ri )2 Ri
(2.10)
Minimizar esta funcin es equivalente a estimar por MCO el siguiente modelo transformado5 : o C 1 i = 1 + 2 Ri Ri ui Ri + Ri i = 1, 2, . . . , 40 (2.11)
donde la perturbacin es homocedstica, no autocorrelada y de media cero: o a E u i Ri Cov u i E Ri =E u i Ri u i Ri E(ui ) = = 0 i Ri

2
V ar
=E
=E
u i Ri
E(u2 ) 2 Ri i = = 2 Ri Ri i=j
uj u i Ri Rj
uj u i Ri Rj
E(ui uj ) = = 0 i, j Ri Rj
A la vista de las propiedades de la perturbacin del modelo transformado el estimador de MCO o de este modelo transformado esto es, el de MCG, es lineal, insesgado y de varianza m nima. Si
Para el modelo transformado podemos escribir la funcin a minimizar, equivalente a las anteriores, como: o 2 N Ci 1 M in 1 2 Ri . Notar que el criterio y el estimador son invariantes al factor de escala 2 . i=1 Ri Ri
5
62
Anlisis de datos a
SARRIKO-ON 04/10
conocemos la distribucin de la perturbacin podemos hacer inferencia en muestras nitas con este o o estimador. Lo veremos ms adelante. a Vamos a formalizar matricialmente el modelo transformado (2.11): P 1 Y = P 1 X + P 1 u Y = X + u donde P es la matriz de transformacin tal que P P = y (P 1 ) P 1 o 1 0 R1 0 0 ... 0 R 0 1 1 0 R2 0 . . . 0 R2 P 1 = . P = . . . . . . . . . ... . . . . . . . . R40 0 0 0 ... 0 0 = 1 : 0 0 . . . 0 ... ... ... ... 0 0 . . .
1 R40
Las matrices transformadas X = P 1 X y Y 1 R1 R1 1 R2 R X = P 1 X = . 2 . . . . . 1 R40 R

40
= P 1 Y son las siguientes: ; Y =P

1
Y =
C 1 R1 C 2 R2
. . .
C 40 R40
La expresin matricial del estimador MCG para el modelo ser o a: M CO = (X X )1 X Y = = ((P 1 X) (P 1 X))1 ((P 1 X) (P 1 Y )) = = (X 1 X)1 (X 1 Y ) = M CG luego: M CG =
40 1 1 Ri 1 40 Ci 1 Ri 40 1 Ci
N
40 1 Ri
La matriz de varianzas y covarianzas del estimador de MCG ser a: V (M CG ) = (X

2 1
X)
40 1 1 Ri
N
40 1 Ri
Un estimador insesgado de dicha matriz de varianzas y covarianzas ser a: V (M CG ) = M CG (X 1 X)1 2 donde: M CG = 2 uM CG 1 uM CG Y 1 Y M CG X 1 Y (Y X M CG ) 1 (Y X M CG ) = = 40 K 40 K 40 K 63
SARRIKO-ON 04/10
Anlisis de datos a
siendo en este caso Y 1 Y =
2 40 Ci 1 Ri .
Resultados de la estimacin del modelo6 : o Ci = 1 + 2 Ri + ui i = 1, 2, . . . , 40
por MCO, luego sin tener en cuenta la existencia de heterocedasticidad Ci = 40, 7676 + 0, 1282 Ri (22,1387) (0,0305) (des(i,M CO )) R2 = 0, 3171 (2.12)
por MCG, luego teniendo en cuenta la heterocedasticidad y suponiendo V ar(ui ) = 2 Ri : Ci = 31, 9243 + 0, 1409 Ri i,M CG )) (17,9860) (0,0269) (des( R2 = 0, 4177 (2.13)
Con respecto a los resultados de la estimacin, en (2.12) no podemos decir nada ya que o hemos detectado la existencia de heterocedasticidad y por lo tanto, las estimaciones i,M CO mostradas no son las mejores posibles ya que han sido obtenidas con un estimador no eciente y en cuanto a des(i,M CO ), corresponden a un estimador sesgado por lo que no son adecuadas para hacer inferencia. Los resultados mostrados en (2.13) tienen en cuenta la existencia de heterocedasticidad. Si la forma funcional propuesta es correcta, el estimador utilizado, M CG , es un estimador eciente y las estimaciones des(i,M CG ) corresponden a un estimador insesgado y son vlidas para a 2 no son comparables, ni tampoco las desviaciones estimadas de los hacer inferencia. Los R coecientes estimados, des(i ). Al estimador de MCG bajo heterocedasticidad tambin se le conoce con el nombre de M e nimos Cuadrados Ponderados, MCP, porque pondera las observaciones inversamente al peso de la varianza de la perturbacin. En la suma de cuadrados de (2.10) se ponderan ms las desviaciones o residuos o a [Ci E(Ci )] con menor varianza que las de mayor varianza o dispersin. Esto es muy fcil de o a entender en el ejemplo desarrollado si observamos la funcin objetivo, la forma de la matriz P 1 y o en denitiva, las variables del modelo transformado.
Ejercicio 2.1
Sea el modelo: Ci = 1 + 2 Ri + ui
donde E(ui ) = 0 i; E(u2 ) = a + bRi ; E(ui uj ) = 0 i, j i = j. Escribe el correspondiente i modelo transformado y demuestra las propiedades de la perturbacin de dicho modelo suponiendo o que a y b son conocidas.
6
Ver Anexo 1.1, Resultados 1 y 4.
64
Anlisis de datos a
SARRIKO-ON 04/10
2.4.
Estimador de M nimos Cuadrados Generalizados Factibles. Especicacin de un modelo para la heterocedasticidad o
En la seccin anterior la matriz de varianzas y covarianzas de la perturbacin es conocida excepto o o por un factor de escala 2 . Cuando los elementos de E(uu ) no son conocidos, E(uu ) = 2 = , no es posible estimar N varianzas ms K coecientes de regresin con N observaciones7 . Una forma a o de abordar el problema es modelar la varianza de la perturbacin en funcin de un conjunto de o o variables observables, Zi , que pueden ser o no regresores del modelo, y de un vector de parmetros a desconocido , cuya dimensin es estimable y no crece con el tamao muestral N : o n
2 i = g(Zi , ),
i de forma que
= ()
Una vez obtenido un estimador de , , se puede denir un estimador de , = (), y estimar el vector de coecientes por el mtodo de M e nimos Cuadrados Generalizados Factibles, MCGF. Bajo ciertas condiciones de regularidad, si el estimador es consistente, el estimador de MCGF tiene buenas propiedades asintticas. o El estimador de MCGF es un estimador en dos etapas. En la primera etapa utilizamos los residuos de MCO para estimar . Dado que el residuo es una aproximacin a la perturbacin, o o ui = Yi Xi M CO = Yi Xi Xi (M CO ) = ui + error
2 y que hemos supuesto E(u2 ) = i = g(Zi , ), entonces podemos denir la ecuacin u2 = g(Zi , ) + o i i error. Si g(Zi , ) es lineal en , por ejemplo Zi , se puede considerar la siguiente regresin auxiliar o para estimar los parmetros : a
u2 = Zi + i i
i = 1, . . . , N
Bajo ciertas condiciones de regularidad, se puede demostrar que el estimador MCO de es consis tente. Una vez obtenido el estimador consistente de , y por lo tanto, de i = g(Zi , ), en la segunda 2 etapa, se sustituye en la funcin suma de cuadrados ponderada y se minimiza con respecto a : o M in (Y X ) 1 (Y X ) = M in obteniendo el estimador de MCGF denido como: M CGF = (X 1 X)1 X 1 Y Veamos una aplicacin de este procedimiento utilizando el ejercicio magistral: o El modelo a estimar es: Ci = 1 + 2 Ri + ui
7
N i=1
1 (Yi Xi )2 i 2
i = 1, 2, . . . , 40
(2.14)
Notar que cuando los elementos de no son conocidos dif cilmente ser conocida 2 , lo lgico es pensar que nada a o en las varianzas es conocido, ni tan siquiera que exista una parte comn en todas ellas, as es habitual denotar a u E(uu ) como .
65
SARRIKO-ON 04/10
Anlisis de datos a
donde E(ui ) = 0 i y E(ui uj ) = 0 i, j i = j. Suponemos que V ar(ui ) = a + bRi siendo a y b constantes desconocidas. La forma funcional que hemos supuesto para la varianza de la perturbacin es razonable con respecto a la informacin disponible, existencia de heterocedasticidad o o y dependencia creciente con respecto a Ri y depende de un nmero de parmetros pequeo que son u a n estimables de forma consistente como veremos a continuacin. o La estructura de la matriz de varianzas y covarianzas del vector de perturbaciones, que evidencia que es desconocida, es la siguiente: E(uu ) = a + bR1 0 0 ... 0 0 a + bR2 0 . . . 0 . . . . . . ... . . . . . . 0 0 0 . . . a + bR40 =
Cmo estimamos los parmetros desconocidos del modelo anterior? o a Nuestro problema ahora es cmo estimar los parmetros desconocidos 1 , 2 , a y b del modelo. El o a modelo transformado para la forma funcional propuesta para la varianza de ui es: C 1 Ri ui i = 1 + 2 + a + bRi a + bRi a + bRi a + bRi i = 1, . . . , 40 (2.15)
En este caso en el modelo transformado tenemos dos constantes desconocidas a y b que deben ser previamente estimadas para poder aplicar el estimador de MCO al modelo (2.15). Para obtener estimadores consistentes de a y b podemos proceder de la forma siguiente: 1. Estimamos por MCO el modelo (2.9) y guardamos los residuos de m nimos cuadrados ordinarios. 2. Estimamos por MCO la siguiente regresin auxiliar: o u2 CO,i = a + bRi + M
i
i = 1, 2, . . . , 40
De esta regresin obtenemos aM CO y M CO estimados consistentemente. o b Una vez estimados consistentemente aM CO y M CO podemos estimar por MCO, o lo que es lo mismo b MCGF, el siguiente modelo transformado: Ci a+ i bR = 1 1 a+ i bR + 2 Ri a+ i bR + ui a+ i bR i = 1, . . . , 40 (2.16)
Los estimadores (1 , 2 )M CGF as obtenidos son consistentes dado que los estimadores de a y b a su vez lo son. Adems, sern asintticamente ecientes. En muestras pequeas no se conocen sus a a o n propiedades porque MCGF es un estimador no lineal. No obstante, al ser un estimador consistente y tener distribucin asinttica conocida podemos utilizarlo para hacer inferencia asinttica vlida, o o o a como veremos ms adelante. a 66
Anlisis de datos a
SARRIKO-ON 04/10
A la hora de implementar el estimador de MCGF es fundamental tener en cuenta que es una matriz de varianzas y covarianzas, luego la variable de ponderacin es i y sta debe ser positiva o 2 e 2 i. Es necesario comprobarlo, ya que si a la hora de estimar i no se impone esta restriccin no o tiene porqu satisfacerse. e En el caso del ejemplo i = a + i no es positiva para las 40 familias de la muestra, por lo que 2 bR la forma funcional elegida para la varianza V ar(ui ) = a + bRi a pesar de ser razonable para la muestra, no es implementable. Debemos probar otras, que tambin sean razonables claro est, por e a 2 . Para esta forma funcional la regresin auxiliar es: ejemplo V ar(ui ) = (a + bRi ) o
2 u2 CO,i = a + bRi + cRi + M i
i = 1, 2, . . . , 40
El correspondiente modelo transformado una vez estimados consistentemente a, b y c es: Ci a + i + cRi bR 2 = 1 1 a + i + cRi bR 2 + 2 Ri a + i + cRi bR 2 + ui a + i + cRi bR 2
i = 1, . . . , 40 La estimacin del modelo por MCO, o lo que igual MCGF para esta ultima forma funcional de la o 8: varianza de la perturbacin proporciona los siguientes resultados o Modelo estimado por MCGF: Ci = 34, 2386 + 0, 1410 Ri i,M CGF )) (17,6042) (0,0289) (des( Si observamos los resultados de la estimacin vemos como cuantitativamente las realizaciones o muestrales de los estimadores MCG y MCGF son muy similares. Sin embargo, es importante recalcar que las varianzas de los estimadores MCG y MCGF no son comparables entre s . El marco de trabajo es distinto. Con el estimador MCG estamos trabajando en trminos de e propiedades en muestras nitas de un estimador y bajo un supuesto concreto en la varianza de la perturbacin y en base a su certeza se demuestran las propiedades del estimador. Con o el estimador de MCGF al ser no lineal buscamos propiedades asintticas bajo el supuesto de o que la forma funcional propuesta para la varianza de la perturbacin es adecuada y adems, o a se ha estimado consistentemente. Pero si el supuesto sobre V ar(ui ) es adecuado con MCGF, ste es asintticamente equivalente a MCG, en el sentido de que ambos estimadores tienen la e o misma distribucin asinttica. o o
2.5.
MCO: Estimador de V (M CO) robusto a heterocedasticidad
En presencia de heterocedasticidad el estimador M nimo Cuadrtico Ordinario es lineal, insesgaa do y consistente, pero no es de varianza m nima. Su matriz de varianzas y covarianzas se dene V (M CO ) = 2 (X X)1 X X(X X)1 . Un estimador de la matriz de varianzas y covarianzas del
8
Ver Anexo 1.1, Resultado 5.
67
SARRIKO-ON 04/10
Anlisis de datos a
estimador MCO es V (M CO ) = 2 (X X)1 . Utilizar este estimador para hacer inferencia cuan do hay heterocedasticidad no es adecuado. Los estad sticos t y F habituales para hacer inferencia sobre denidos en base a este estimador de la matriz de varianzas y covarianzas de M CO son inapropiados ya que es un estimador sesgado e inconsistente. La dicultad que entraa el conocimiento de , o en su caso, hace interesante el poder contar con n M CO ) consistente y robusto a la posible existencia de heterocedasticidad y de un estimador de V ( esta forma derivar estad sticos vlidos, al menos asintticamente, para contrastar hiptesis sobre el a o o M CO . vector de coecientes utilizando White (1980) demuestra que un estimador consistente de la matriz de varianzas y covarianzas asinttica de M CO en presencia de heterocedasticidad es: o V (M CO )W hite = (X X)1 (X SX)(X X)1 donde S = diag(2 , u2 , . . . , u2 ). Esta matriz de varianzas y covarianzas consistente asintticamente u1 2 N o M CO sin tener puede ser utilizada para hacer inferencia vlida al menos asintticamente utilizando a o que especicar a priori la estructura de heterocedasticidad. Aplicacin del estimador de White de la matriz de varianzas y covarianzas del estimador o MCO al ejercicio propuesto9 : Ci = 40, 7676 + 0, 1282 Ri (22, 1387) (0, 0305) des(i,M CO ) i,M CO )W hite (27, 3213) (0, 0439) des( (2.17)
Notar que los coecientes han sido estimados por MCO, estimador lineal, insesgado, consis2 tente y no de varianza m nima dado que E(u2 ) = i . El estimador, des(i,M CO ) se obtiei 2 (X X)1 estimador sesgado e inconsistente bajo heterocedasticidad. Sin embargo, ne de i,M CO )W hite es un estimador consistente de des(i,M CO ) y ha sido obtenido con la expre des( 1 (X SX)(X X)1 . En este ejercicio en concreto se observa que con el estimador sin (X X) o des(i,M CO ) = 2 (X X)1 , sesgado e inconsistente se estaba subestimando la desviacin t o pi ca poblacional de M CO , que es la ra cuadrada del elemento i-simo de la diagonal principal z e de 2 (X X)1 . El problema de estimacin de los parmetros de inters como una cuestin de objetivos e inforo a e o macin disponible: o Si conocemos la forma funcional de la varianza de la perturbacin, es decir, si conocemos y si o nuestro objetivo es obtener estimadores lineales, insesgados y de varianza m nima estimaremos por MCG. Si no conocemos habremos de estimarla y una vez estimada podremos sustituirla en la expresin del estimador. En este caso nuestro estimador es MCGF, denido como: o M CGF = (X 1 X)1 (X 1 Y )
9
Anexo 1.1, Resultado 6.
68
Anlisis de datos a
SARRIKO-ON 04/10
Bajo ciertas condiciones sucientes el estimador es consistente y podremos obtener una distribucin o asinttica conocida que nos permitir realizar inferencia asinttica. o a o En ocasiones modelizar , o estimarla si es desconocida no resulta fcil. En estas ocasiones puea de resultar preferible quedarnos con el estimador de los coecientes por MCO y ocuparnos de cmo realizar inferencia vlida con este estimador en estas circunstancias. En este caso una solucin o a o podr ser obtener un estimador de la matriz de varianzas y covarianzas de los estimadores MCO a con adecuadas propiedades, en concreto consistente y robusto a la posible existencia de heterocedasticidad. La utilizacin del estimador MCO, consistente en presencia de heterocedasticidad y la o matriz de varianzas y covarianzas propuesta nos permitir realizar inferencia asinttica sin tener a o que establecer la forma funcional de la heterocedasticidad. Hay que notar que el estimador de White permite a los investigadores no arriesgarse a manipular los datos a la bsqueda de una forma funcional de la heterocedasticidad cuando esta no est muy u a clara y realizar inferencia asinttica. Sin embargo, no soluciona la cuestin de la ineciencia del o o estimador.
2.6.
Contraste de restricciones lineales
Una vez hemos estimado adecuadamente los coecientes del modelo de inters es probable que e nuestro objetivo sea realizar contraste de hiptesis. En el tema anterior ya se vio con detalle cmo o o contrastar restricciones lineales10 . Sean las hiptesis nula y alternativa para el contraste de q reso tricciones lineales: H0 : R = r Ha : R = r donde R es una matriz (q K) y r es un vector de dimensin (q 1), siendo q el nmero de o u restricciones lineales a contrastar. Estad sticos basados en el estimador de por MCG o MCP. En este caso Y = X + u u N (0, 2 ) y es conocida el estimador MCG es lineal en u, insesgado y de varianza m nima, su distribucin en muestras nitas o es: M CG N (, 2 (X 1 X)1 ) Estad sticos de contraste y distribucin asociada: o Para q = 1 RM CG r R 2 (X 1 X)1 R
10
H0
t(N K)
La notacin utilizada para el tamao muestral en ese tema era T en lugar de N . o n
69
SARRIKO-ON 04/10 para q > 1
Anlisis de datos a
(RM CG r) [R (X 1 X)1 R ]1 (RM CG r)/q H0 F(q,N K) 2 (Y X M CG ) 1 (Y X M CG ) . N K
siendo un estimador insesgado de 2 , M CG = 2 Las reglas de decisin son las habituales. o
Ejemplo 2.8 En el modelo Ci = 1 + 2 Ri + ui ui N (0, 2 Ri ) contrastamos la signicatividad de la variable Ri con el estad stico y distribucin siguientes: o H0 : 2 = 0 versus Ha : 2 = 0 2,M CG H0 t(402) 2,M CG ) des(
Rechazamos la hiptesis nula de no signicatividad de la variable renta para = 5 % si el valor o muestral del estad stico t es tal que t > t(402)|0,025 . Ejercicio 2.2 Sea el modelo: Y = X + u u N (0, ) conocida
Deriva la distribucin del estimador MCG de y el estad o stico de contraste y su distribucin o asociada para contrastar H0 : R = r. Ejercicio 2.3 Sea el modelo Y = X + u u N (0, 2 ) y es conocida
En el modelo transformado correspondiente, deriva la distribucin del estimador MCO de y el o estad stico de contraste y su distribucin asociada para contrastar H0 : R = r. o Estad sticos basados en el estimador de por MCGF En este caso Y = X + u u N (0, ) desconocida, pero estimable consistentemente
El estimador de MCGF, M CGF = (X 1 X)1 (X 1 Y ), es un estimador no lineal y en general sesgado, cuya distribucin en muestras nitas no es conocida. En muestras grandes es un estimador o consistente si es un estimador consistente de . Su distribucin asinttica es: o o d N (M CGF ) N (0, G1 ) Los estad sticos de contraste y distribucin asociada utilizando como estimador de G1 = plim o a N V (M CGF ) = N (X 1 X)1 son: 70
1 NX
Anlisis de datos a para q = 1 RM CGF r R (X 1 X)1 R para q > 1

d,H0
SARRIKO-ON 04/10
N (0, 1)
d,H0 (RM CGF r) [ R (X 1 X)1 R ]1 (RM CGF r) 2 q
Las reglas de decisin son las habituales. o
Ejemplo 2.9 En el modelo Ci = 1 +2 Ri +ui ui N (0, a+bRi ) contrastamos la signicatividad de la variable Ri con el estad stico y distribucin siguientes: o H0 : 2 = 0 versus Ha : 2 = 0
2,M CGF d,H0 N (0, 1) des(2,M CGF ) Rechazamos la hiptesis nula de no signicatividad de la variable renta para = 5 % si el valor o muestral del estad stico t es tal que t > N (0, 1)| 0,05 .
2
Estad sticos basados en el estimador de por MCO y un estimador robusto a hete rocedasticidad de V (M CO ) En este caso Y = X + u u N (0, ) desconocida y dif de modelar y estimar consistentemente cil
Dado que el estimador MCO es consistente y V (M CO )W hite tambin lo es bajo heterocedasticidad e podemos utilizarlos conjuntamente para hacer inferencia asinttica vlida. En este caso el estad o a stico vlido para realizar contraste de hiptesis de la forma H0 : R = r y su distribucin asinttica a o o o asociada son:
d,H0 (RM CO r) (R V (M CO )W hite R )1 (RM CO r) 2 q
Siendo q el nmero de restricciones de contraste. Para q = 1 podemos escribir el estad u stico anterior como: RM CO r R V (M CO )W hite R
d,H0
N (0, 1)
71
SARRIKO-ON 04/10
Anlisis de datos a
2 2 Ejemplo 2.10 En el modelo Ci = 1 + 2 Ri + ui ui N (0, i ), siendo i desconocida, contrastamos la signicatividad de la variable Ri utilizando el estimador MCO de 2 con el estad stico y distribucin siguientes: o H0 : 2 = 0 versus Ha : 2 = 0
2,M CO d,H0 N (0, 1) 2,M CO )W hite des( Rechazamos la hiptesis nula de no signicatividad de la variable renta para = 5 % si el estad o stico calculado t es tal que t > N (0, 1)| 0,05 .
2
2.7.
Resumen de los resultados obtenidos en el ejercicio magistral
En esta seccin vamos a resumir los resultados obtenidos en este tema. Para ello vamos utilizar el o ejercicio magistral. En el ejemplo nos propon amos estudiar la relacin entre consumo y renta para o lo cual se dispon de 40 observaciones de ambas variables. a Ci = 1 + 2 Ri + ui Los resultados de la estimacin MCO son: o Ci = 40, 7676 + 0, 1282 Ri (22,1387) (0,0305) (des(i,M CO )) R2 = 0, 317118 GQ = 3, 34 BP = 11, 28 i = 1, . . . , 40
Dados lo valores muestrales de los estad sticos GQ y BP , para ambos rechazamos la hiptesis nula o de homocedasticidad. La perturbacin del modelo es heterocedstica y el estimador MCO utilizado o a para estimar, aunque es un estimador lineal, insesgado y consistente no es de varianza m nima. Las desviaciones t picas estimadas para los parmetros se han calculado en base a la expresin a o V (M CO ) = 2 (X X)1 , estimador sesgado e inconsistente de V (M CO ) por lo que no deben ser utilizadas para hacer inferencia. Los estad sticos t y F habituales para realizar inferencia no siguen las distribuciones t-Student y F-Snedecor que les corresponden. A partir de la Figura 2.8 y de los resultados de los contrastes de heterocedasticidad se ha supuesto 2 que V ar(ui ) = i = 2 Ri y se ha reestimado el modelo por MCP con los siguientes resultados: Ci = 31, 9243 + 0, 1409 Ri (17,9860) (0,0269) (des(i,M CG ))
R2 = 0, 417757
2 Si la forma funcional propuesta para i es correcta, el estimador MCP es un estimador lineal, insesgado y de varianza m nima. Si la perturbacin es normal, el estimador MCP sigue una distrio M CG N (, 2 (X 1 X)1 ) vlida para hacer inferencia. El bucin normal en muestras nitas, o a estad stico calculado para la H0 : 2 = 0 frente a Ha : 2 = 0 es t = 4, 20 > 2, 02 = t(402)|0,025 , luego para un nivel de signicatividad = 5 % la variable es signicativa para explicar el consumo de los individuos.
72
Anlisis de datos a
SARRIKO-ON 04/10
Respecto a la bondad del ajuste no podemos decir nada. Bajo heterocedasticidad el coeciente R2 calculado en el modelo original no tiene la interpretacin que conocemos. Adems, hay que tener o a mucho cuidado con su interpretacin cuando trabajamos en el modelo transformado ya que en o muchos casos tras la transformacin, el modelo no tiene trmino independiente. o e Una alternativa a la forma funcional propuesta para V ar(ui ) y coherente tanto con la Figura 2.8 como con los resultados de los estad sticos de contraste utilizados para contrastar la existencia de heterocedasticidad es V ar(ui ) = (a + bRi )2 . En este caso hay dos coecientes desconocidos en la forma funcional propuesta por lo que el estimador MCG (o MCP) no es aplicable. El modelo debe ser estimado por MCGF y los resultados de dicha estimacin son: o Ci = 34, 2386 + 0, 1410 Ri (17,6042) (0,0289) (des(i,M CGF )) Si la forma funcional propuesta es correcta el estimador MCGF es un estimador no lineal y consistente si i a su vez es consistente. Adems, es eciente asintticamente y tiene distribucin 2 a o o asinttica conocida y vlida para hacer inferencia asinttica. En este caso el estad o a o stico calculado para la H0 : 2 = 0 frente a Ha : 2 = 0 es t = 4, 87 > 1, 96 = N (0, 1)|0,025 , luego para un nivel de signicatividad = 5 % la variable renta es signicativa asintticamente para explicar el consumo o de los individuos. Los estimadores MCG y MCGF propuestos son correctos y adecuados para las formas funcionales propuestas para la varianza de la perturbacin, cada uno en su contexto. Sin embargo, si proponemos o V ar(ui ) = 2 Ri y la forma funcional correcta es otra distinta, por ejemplo V ar(ui ) = (a + bRi )2 el estimador MCG no posee las propiedades indicadas. Y viceversa. Es por ello, que ante esta dicultad, en muchas ocasiones sea ms adecuado no realizar ningn supuesto sobre V ar(ui ), y a u utilizar el estimador de MCO combinado con un estimador consistente de su matriz de varianzas y covarianzas bajo heterocedasticidad y realizar inferencia con ellos. Para el caso de heterocedasticidad el estimador robusto a heterocedasticidad de V (M CO ) es el estimador de White. Si optamos por esta solucin para estimar y realizar inferencia, los resultados obtenidos son: o Ci = 40, 7676 + 0, 1282 Ri (27,3213) (0,0439) (des(i,M CO )W hite ) El estimador MCO utilizado para estimar los coecientes del modelo es lineal, insesgado y no es de varianza m nima. Sin embargo, es consistente, al igual que lo son las desviaciones t picas estimadas con el estimador de White. Por ello podemos utilizar el estad stico t-habitual con distribucin o asinttica N (0, 1) para contrastar la signicatividad de la variable renta, H0 : 2 = 0 frente a o Ha : 2 = 0. En este caso t = 2, 91 > 1, 96 = N (0, 1)|0,025 , luego para un nivel de signicatividad = 5 % la variable es signicativa para explicar el consumo de los individuos.
2.8.
Adems, de los ejercicios que se resuelven en clase tenis a vuestra disposicin una coleccin de a e o o ejercicios de examen que se actualiza cada ao, la Recopilacin de exmenes de Econometr No n o a a. deber dar por acabado el trabajo de cada tema hasta que estn hechos los ejercicios recomendados ais e 73
SARRIKO-ON 04/10
Anlisis de datos a
en clase. A continuacin se proponen varios ejercicios, algunos de esa coleccin, cuyas dudas se o o resolvern a lo largo de las clases magistrales. a Ejercicio M-H.1: Sea el modelo: Yi = 1 + 2 X2i + 3 X3i + ui
2 ui (0, i )
i = 1, . . . , 10
con X2 , y X3 no estocsticas. Indica para cada uno de los siguientes modelos transformados cual a 2 ser la correspondiente forma funcional que se supone para i y escribe la correspondiente matriz a de varianzas y covarianzas de ui bajo el supuesto de que Cov(ui , uj ) = 0 i = j: 1.
Yi X2i 1 = 1 X2i + 2 + 3 X3 i + X2i ui X2i
2 2. Yi X3i = 1 X3i + 2 X2i X3i + 3 X3i + ui X3i X2i 1 3. Yi = 1 X + 2 X + 3 X3i + ui X X

3i 3i 3i 3i
Ejercicio M-H.2: Con una muestra de 15 pa se desea estimar el efecto que un aumento en las cotizaciones de la ses Seguridad Social tendr sobre la parte de las cotizaciones a cargo de los trabajadores. La infora macin, correspondiente al ao 1982, de las cotizaciones a la Seguridad Social (CSS) y la parte o n correspondiente a los trabajadores (CSST ), en ambos casos como porcentaje del total de ingresos scales, se presenta en las dos primeras columnas de la siguiente tabla: CSS 31,9 29,8 2,8 43,2 36,2 15,0 47,2 30,4 28,0 41,6 28,5 46,5 31,0 16,9 27,7 CSST 13,5 10,1 1,5 11,5 16,1 5,4 7,1 10,7 11,2 18,0 10,8 10,3 10,2 7,6 10,8 u -0,08327 -2,97434
Austria Blgica e Dinamarca Francia Alemania Irlanda Italia Japn o Luxemburgo Pa Bajos ses Portugal Espaa n Suiza Reino Unido EE.UU. Consideramos el siguiente modelo:
-1,65393 0,38986 1,39732 0,89160 -0,23700 0,14433 1,06076
CSSTi = 1 + 2 CSSi + ui 74
i = 1, . . . , 15
Anlisis de datos a
SARRIKO-ON 04/10
Los resultados de la estimacin del modelo anterior por MCO con la muestra de los 15 pa son o ses los siguientes:
CSST i (t-estad.) R2 = 0, 365
3, 8823 + 0, 211442 CSSi (1,69) (3,01) SCR = 132, 7767
(2.18)
1. F jate en la tabla, en la tercera columna se muestran los residuos MCO, ui . Indica la forma general de obtener ui . A continuacin completa los que faltan en la misma tabla y en la Figura o 2.9. Figura 2.9: CSSi versus residuos MCO
6
Residuos MCO
-2
-4
-6
-8 5 10 15 20 25 CSS 30 35 40 45
2. Una vez completado el grco comenta si crees que puede existir algn problema razonando a u tu respuesta. 3. Con la siguiente informacin lleva a cabo el contraste de Goldfeld y Quandt. Debes de compleo tar la informacin que falta y sealar claramente todos los elementos del contraste incluidas o n la hiptesis nula y la alternativa. o Primera submuestra: CSST i = 0, 463351 + 0, 374431 CSSi 75 (2.19)
SARRIKO-ON 04/10
Anlisis de datos a
CSSTi CSSi u1
1,5 2,8 -0,011759 0,808758 0,25257
Segunda submuestra: CSST i = 28, 9928 0, 395203 CSSi (2.20)
CSSTi CSSi u2
13,5 31,9 1,413507 -0,420075 -3,239264
4. Dada la evidencia obtenida en los apartados anteriores y con la siguiente informacin, o estima ecientemente los coecientes del modelo. Explica cmo se obtiene este estimador y o qu supuestos se estn haciendo para que este estimador sea de varianza m e a nima. CSSTi /CSSi 2,12814 1/CSSi 0,3672255 0,1463262 Constantei = 1 5,47296 0,8374455 15
CSSTi /CSSi 1/CSSi Constantei = 1 donde por ejemplo
CSSTi /CSSi = 5, 47296.
5. Con el estimador que has propuesto en el apartado anterior contrasta la hiptesis nula o de que un aumento en las cotizaciones de la Seguridad Social recaer totalmente sobre los a trabajadores esto es, H0 : 2 = 1. Indica todos los supuestos necesarios para que sea vlido el a contraste.
Ejercicio M-H.3: La seccin de estudios de mercado de la empresa Lydia Pinkham quiere analizar la inuencia de o la publicidad en sus ventas11 . Para ello dispone de observaciones anuales para el periodo de 1907 a 1960 sobre las ventas de su producto, V , y los gastos en publicidad, G, ambas en millones de dlares. Se propone la siguiente relacin: o o Vt = 1 + 2 Gt + 3 G2 + ut t
11
(2.21)
En el Apndice tenis recogidos los datos en la Tabla A.4 e e
76
Anlisis de datos a
SARRIKO-ON 04/10
El jefe de la seccin presenta al gerente de la empresa los resultados de la estimacin MCO junto o o con los grcos mostrados en la Figura 2.10: a Vt = 0,163 + 2, 825 Gt 0, 0642 G2 t (0,635) (0,288) (0,317) R2 = 0, 7366 SCR = 5, 589
(2.22)
Figura 2.10: Variables y Residuos MCO del modelo

V con respecto a G (con ajuste mnimocuadrtico) 3.5 Y = 0,489 + 1,44X 0.6 3 0.4 2.5 0.2 0 0.2 0.4 0.6 1 0.8 0.5 0.4 0.6 0.8 1 G 1.2 1.4 1.6 1.8 1 0.4 0.6 0.8 1 G 1.2 1.4 1.6 1.8 0.8 Residuos de la regresin (= V observada estimada)
1.5
Ventas versus Gastos
residuo
Residuos MCO versus Gastos
1. El gerente no est satisfecho con estos resultados, qu problemas crees que reejan los grcos a e a anteriores? El jefe de seccin propone dos posibles v para mejorar el estudio. La primera consiste en estimar o as por MCO la siguiente ecuacin: o V 1 t = 1 + 2 Gt Gt G2 ut Gt + 3 t + Gt Gt (2.23)
2. Cul es la hiptesis bsica que se debe incumplir en el modelo (2.21) para utilizar el modelo a o a (2.23)? Qu solucin se est proponiendo? En qu se espera mejorar con respecto a la e o a e estimacin MCO (2.22)? o 3. A la vista de la Figura 2.11 en la que se representan los residuos del ajuste MCO del modelo Vt (2.23) y la variable V = G sobre G = Gt crees que se est resolviendo correctamente a t el problema? La segunda alternativa es que la relacin entre ventas y gastos en publicidad no sea lineal. Se estima o por MCO el siguiente modelo log-lineal para la relacin publicidad-ventas: o LnVt = 1 + 2 LnGt + vt 77 (2.24)
SARRIKO-ON 04/10
Anlisis de datos a
Figura 2.11: Variables y residuos MCO del modelo transformado

V* con respecto a G* (con ajuste mnimocuadrtico) 2.8 Y = 0,886 + 1,06X 2.6 0.4 2.4 0.2 residuos MCO 0.6 0.7 0.8 0.9 1 G* 1.1 1.2 1.3 1.4 2.2 0.6 0.8
V*
-0.2
1.8
-0.4
1.6
-0.6
1.4
-0.8
1.2
-1 0.6 0.7 0.8 0.9 1 G* 1.1 1.2 1.3 1.4
Ventas* versus Gastos*
Residuos MCO* versus Gastos*
con los siguientes resultados: LnV t = 0, 656 + 0, 778 LnGt (0,025) (0,060) (des(i,M CO )) R2 = 0, 7603 SCR = 1, 5452 (2.25)
vt 2 = 1, 052 + 0, 367 LnGt 0, 028 (0,193) (0,467)
R2 = 0, 0117
SCR = 92, 1022
(2.26)
4. Interpreta los coecientes estimados de este modelo. 5. Crees que el modelo (2.24) presenta el mismo problema de incumplimiento de hiptesis que o el modelo (2.21)? Justica tu respuesta mediante un contraste. Explica detalladamente lo que haces y por qu lo haces. e 6. Alguna de las dos soluciones propuestas te parece mejor que la otra? Razona tu respuesta.
Ejercicio M-H.4: Se desea analizar la siguiente la relacin entre los gastos agregados en sanidad, Y y la renta agregada, o X, ambos en billones de dlares, para 51 estados norteamericanos12 : o Yi = 1 + 2 Xi + ui (2.27)
12 Fichero data3-2.gdt, disponible en gretl pestaa Ramanathan. Fuente: Statistical Abstract of U.S. (1995), recogida n en Ramanathan, R. (2002), Introductory econometrics with applications, 5th. Ed., South-Western.
78
Anlisis de datos a
SARRIKO-ON 04/10
Los resultados de la estimacin por M o nimos Cuadrados Ordinarios son los siguientes: Yi (des(i,M CO )) i,M CO )W hite ) (des( u2 i
uu N
0, 3256 + 0, 1420 Xi (0, 3197) (0, 0019) (0, 2577) (0, 0031)
R2 = 0, 999
= 0, 113 + 0, 008Xi + i
R2 = 0, 3269
SCE = 55, 89
(2.28)
Posteriormente, se dibujan los residuos frente a la renta agregada (Figura 2.12). Figura 2.12: Residuos MCO frente a Renta Agregada
5 4 3 2 1 residuo 0 -1 -2 -3 -4 -5 0 100 200 300 Renta 400 500 600 700
1. Explica cmo crees que se han calculado los residuos y para qu crees que se ha dibujado la o e Figura 2.12. Interprtala. e 2. Teniendo en cuenta la Figura 2.12 realiza el contraste que consideres oportuno. 3. Explica, razonando tu respuesta, qu estad e stico utilizar para contrastar la signicatividad as de la variable renta. Realiza el contraste detallando todos sus elementos. 4. A la vista de los resultados de la estimacin del modelo (2.27) el investigador estima de o nuevo el modelo suponiendo la siguiente estructura para la varianza de la perturbacin: o 2X . V ar(ui ) = i Se obtienen los siguientes resultados:
79
SARRIKO-ON 04/10
Anlisis de datos a
Estimaciones MC.Ponderados utilizando las 51 observaciones 151 Variable dependiente: gasto sanitario Variable utilizada como ponderacin: 1/renta o Coeciente const renta 0,1045 0,1442 Desv. t pica 0,1624 0,0025 estad stico t 0,6432 55,5126 valor p 0,5231 0,0000
Estad sticos basados en los datos ponderados: Suma de cuadrados de los residuos Desviacin t o pica de los residuos 1,145344 0,152887 R2 Adjusted R2 0,984348 0,984029
a) Razona la forma funcional escogida para la varianza de la perturbacin. Explica cmo o o crees que se han obtenido las estimaciones. b) Suponiendo normalidad en la perturbacin, contrasta la signicatividad de la variable o renta.
5. El investigador no se siente conforme con la forma funcional escogida para V ar(ui ) y propone reestimar el modelo (2.27) suponiendo que V ar(ui ) = a + bXi , donde a y b son desconocidos. a) Explica detalladamente cmo estimar los coecientes del modelo (2.27) bajo este suo as puesto. b) Suponiendo i = a + i . Realiza dicha estimacin con la siguiente informacin muestral: 2 bX o o u2 = 148, 699 i (1/i )2 = 34, 738 (Xi /i 2 ) = 1608, 337 u2 Xi = 34945, 67 i (Yi /i 2 ) = 236, 139 (Yi2 /i 2 ) = 4168, 919 (Xi /i )2 = 196420, 998 (Yi Xi /i 2 ) = 28484, 578
c) Contrasta la signicatividad de la variable explicativa. 6. Qu comentar sobre la validez de los contrastes realizados en los apartados 3), 4.b) y 5.c)? e as
2.9.
Prcticas de Aula a
Las prcticas de aula son clases participativas, ello quiere decir que el alumno debe acudir a clase a con el ejercicio realizado en su tiempo de trabajo personal. Previamente y con anticipacin sucieno te se le habr realizado la debida propuesta. Durante la clase se preguntar aleatoriamente a los a a 80
Anlisis de datos a alumnos sobre lo realizado.
SARRIKO-ON 04/10
En el tema de heterocedasticidad es habitual disponer de dos prcticas de aula, lo que equivale a a dos horas de clase presencial y cuatro horas de trabajo personal. Si el ejercicio ha sido realizado previamente por el alumno, el tiempo es suciente para su correccin y solucin de las dudas o o existentes. A continuacin se van a proponer los enunciados correspondientes a las dos prcticas o a citadas.
Competencias a trabajar en estas sesiones. 1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e
Prctica de Aula PA-H.1: a Se dispone de una base de datos sobre el precio de venta y distintas caracter sticas de 224 viviendas pertenecientes a dos reas residenciales del condado de Orange en California (USA), Dove Canyon a y Coto de Caza 13 . Dove Canyon es una zona de viviendas relativamente pequeas construidas alren dedor de un campo de golf. Coto de Caza es un rea de mayor nivel de vida, aunque ms rural con a a viviendas ms grandes. Las variables que se consideran son: a salepric sqft age city : : : : precio de venta de la vivienda en miles de dlares o tamao de la vivienda en pies cuadrados n edad de la vivienda en aos n 1 si est en Coto de Caza, 0 si est en Dove Canyon a a
A continuacin se muestran los resultados de la estimacin por M o o nimos Cuadrados Ordinarios (MCO) de un modelo para el precio de venta de la vivienda utilizando esa base de datos: RESULTADOS A: Estimaciones MCO utilizando las 224 observaciones 1224 Variable dependiente: salepric Coeciente const sqft age city 440,31 0,2520 3,6980 91,8038 Desv. t pica 35,3203 0,0081 3,0241 21,7494 estad stico t 12,4663 30,9047 1,2228 4,2210 valor p 0,0000 0,0000 0,2227 0,0000
13 Fichero data7-24.gdt, disponible en gretl pestaa Ramanathan. Recogida en Ramanathan, Ramu (2002), Intron ductory econometrics with applications, 5th. edn., South-Western.
81
SARRIKO-ON 04/10 Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o R2 R2 corregido F (3, 220) 642,929 371,376 4,27804e+06 139,4480 0,8609 0,8590 453,8840
Anlisis de datos a
1. Escribe el modelo terico que se ha estimado y comenta los resultados obtenidos en trminos o e de bondad de ajuste, signicatividad y signos de los coecientes estimados. Figura 2.13: Grco de residuos MCO sobre las observaciones i = 1, . . . , 224 y sobre la variable sqft a
Residuos de la regresin (= salepric observada estimada) 800 800 Residuos de la regresin (= salepric observada estimada)
600
600
400
400
residuos MCO
residuos MCO
200
200
200
200
400
400
600
600
800 800 0 50 100 150 200 3000 4000 5000 6000 7000 sqft 8000 9000 10000 11000
2. Analiza de forma razonada la informacin que te proporcionan los grcos recogidos en la o a Figura 2.13 y la regresin auxiliar. Si realizas algn contraste, indica todos los elementos del o u mismo. Cul de los grcos es ms informativo y por qu? a a a e ui 2 = 5, 94184 + 0, 00172457 sqfti SCRA /224 (-10,387) (12,727) 2 N = 224 R = 0, 421826 SCR = 1478, 52 A continuacin se muestran los resultados de la estimacin por MCO utilizando un estimador de la o o matriz de varianzas y covarianzas de los coecientes consistente, aunque exista heterocedasticidad. RESULTADOS B: Estimaciones MCO utilizando las 224 observaciones 1224 Variable dependiente: salepric Desviaciones t picas robustas ante heterocedasticidad, variante HC3 Coeciente const sqft age city 440,31 0,2520 3,6980 91,8038 Desv. t pica 110,8800 0,0279 5,1672 26,3997 82 estad stico t 3,9711 9,0120 0,7157 3,4774 valor p 0,0001 0,0000 0,4750 0,0006
Anlisis de datos a Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o R2 R2 corregido F (3, 220)
SARRIKO-ON 04/10 642,9290 371,3760 4,27804e+06 139,4480 0,8609 0,8590 161,8190
1. En qu var los resultados mostrados ahora (RESULTADOS B) con los primeros (RESULe an TADOS A)? Por qu? Cules son ables y para qu? Explica razonadamente. e a e Por ultimo, se muestran los resultados de la estimacin por M o nimos Cuadrados Generalizados o Ponderados utilizando como variable de ponderacin el inverso del cuadrado del tamao de la o n 1 vivienda esto es, sqf t2 . RESULTADOS C: Estimaciones MC.Ponderados utilizando las 224 observaciones 1224 Variable dependiente: salepric Variable utilizada como ponderacin: 1 2 o sqf t Coeciente const sqft age city 285,20 0,2155 0,5492 110,7800 Desv. t pica 37,2121 0,0095 2,2800 15,6896 estad stico t 7,6643 22,4752 0,2409 7,0607 valor p 0,0000 0,0000 0,8098 0,0000
Estad sticos basados en los datos ponderados: Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o R2 R2 corregido F (3, 220) 0,15074 0,02617 0,79881 0,79607 291,177
Estad sticos basados en los datos originales: Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o 642,929 371,376 4,73514e+06 146,708
1. Qu se quiere decir con datos ponderados y datos originales? Por qu se utiliza como variable e e 2 ? Explica razonadamente. de ponderacin el inverso de sqf t o 2. Qu resultados de los tres A,B, C te parecen mejores? Por qu? e o e
83
SARRIKO-ON 04/10 Prctica de Aula PA-H.2: a
Anlisis de datos a
Una agencia de viajes de Chicago quiere analizar si hay diferencias signicativas entre las familias en la eleccin del destino de vacaciones, ms o menos alejados de su lugar de residencia, en funcin o a o del nmero de hijos pequeos en la familia. Para ello dispone de una muestra de 200 familias de u n esta ciudad entrevistadas en el ao 2007 y se especica el siguiente modelo14 : n M ilesi = 1 + 2 Incomei + 3 agei + 4 kidsi + ui i = 1, . . . , 200 (2.29)
donde M iles son las millas recorridas por una familia en las vacaciones de ese ao, Income es la n renta familiar anual en miles de dlares, age es la edad media de los adultos en la familia y kids el o nmero de hijos menores de 16 aos existentes en la familia. u n Una primera estimacin del modelo por MCO produce los siguientes resultados: o M ilesi = 391, 55 + 14, 201 Incomei + 15, 741 agei 81, 826 kidsi (169,8) (1,80) (3,757) (27,13) (des(M CO )) 2 R = 0, 340605 SCR = 40099000 (2.30)
Figura 2.14: Grco de residuos MCO sobre la variable Income y sobre la variable age a
Residuos de la regresin (= Miles observada estimada) 2000 2000 Residuos de la regresin (= Miles observada estimada)
1500
1500
1000
1000
residuo
residuo
500
500
500
500
1000
1000
1500 20 40 60 Income 80 100 120
1500 25 30 35 40 age 45 50 55
1. Qu te sugieren los grcos recogidos en la Figura 2.14? Comenta detalladamente cada uno e a de ellos.
Despus de agrupar las observaciones de todas las variables en dos grupos en funcin de un ordee o namiento decreciente de la variable Income y estimar el modelo (2.29) anterior por MCO separadamente para cada grupo, se obtienen las siguientes resultados:
14 Fichero vacation.dat. Recogido en Hill, R. C., Griths, W. e. y G. C. Judge (2001), Undergraduate Econometrics, 2a edn., John Wiley and Sons, Inc.
84
Anlisis de datos a
SARRIKO-ON 04/10
Primera submuestra: Estimaciones MCO utilizando las 80 observaciones 180 Variable dependiente: Miles Variable Coeciente Desv. t pica Estad stico t valor p const Income age kids 129,22 13,1490 13,3666 114,1800 615,6100 6,1456 7,5921 52,9888 0,2099 2,1396 1,7606 2,1549 2,42765e+07 0,116112 0,8343 0,0356 0,0823 0,0343
Suma de cuadrados de los residuos R2
Segunda submuestra: Estimaciones MCO utilizando las 80 observaciones 121200 Variable dependiente: Miles Variable const Income age kids Coeciente 339,64 9,6880 18,6511 66,0260 Desv. t pica 220,1600 4,0104 3,8740 29,8963 Estad stico t 1,5427 2,4157 4,8143 2,2085 7,04816e+06 0,308962 valor p 0,1271 0,0181 0,0000 0,0302
2. Realiza un contraste para vericar si lo que sugieren los grcos es estad a sticamente signicativo. Debes sealar claramente todos los elementos del contraste incluidas la hiptesis nula y n o la alternativa. 3. Si el contraste realizado te diera que rechazas la hiptesis nula, qu cambiar de los resultao e as dos presentados en (2.30) si no quisieras cambiar el mtodo de estimacin de los coecientes? e o Por qu y para qu lo har e e as? Explica detalladamente.
Se ha utilizado un mtodo de estimacin alternativo a MCO para mejorar en trminos de eciencia la e o e estimacin de los coecientes . Utilizando el software gretl se han obtenido los siguientes resultados: o Estimaciones MC.Ponderados utilizando las 200 observaciones 1200 Variable dependiente: Miles 1 Variable utilizada como ponderacin: Income o Variable const Income age kids Coeciente 408,37 13,9705 16,3483 78,3630 Desv. t pica 145,7170 1,6482 3,4222 24,7355 85 Estad stico t 2,8025 8,4762 4,7771 3,1680 valor p 0,0056 0,0000 0,0000 0,0018
SARRIKO-ON 04/10 Estad sticos basados en los datos ponderados: Suma de cuadrados de los residuos Desviacin t o pica de los residuos ( ) 2 R R2 corregido F (3, 196) 580616,00 54,4272 0,3907 0,3813 41,8975
Anlisis de datos a
Estad sticos basados en los datos originales: Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de los residuos ( ) 1054,2300 552,7990 4,01134e+07 452,3940
4. Completa las siguientes expresiones sobre el trmino de perturbacin del modelo y el mtodo e o e de estimacin utilizado en la obtencin de estos resultados. o o E(ui ) =
i=....
E(u2 ) = i
E(ui uj ) =
E(uu )
(........ .......)
Criterio de estimacin:........ SCR = o Yi = ...................;

X1i
(Yi 1 X1i 2 X2i 3 X3i 4 X4i )2

X2i = ...................;
i=....
= .....................;
X3i = ...........................;
X4i = .............................; 1
......
86
Anlisis de datos a
SARRIKO-ON 04/10
5. Si tuvieras que contrastar H0 : 2 = 10 Cmo lo har o as? Razona y explica tu respuesta.
2.10.
Prcticas de Ordenador a
Las prcticas de ordenador se realizan en el Laboratorio Informtico donde cada alumno dispone a a de una terminal. Son clases prcticas en las que es importante la colaboracin del alumno para que a o se progrese en el aprendizaje. En general se proporcionar el enunciado de la tarea a trabajar con a anticipacin por si el alumno quiere investigar con el software gretl por su cuenta. o En el tema de heterocedasticidad es habitual disponer de dos prcticas de ordenador que equivalen a a dos horas presenciales y cuatro horas de trabajo no presencial. A continuacin se va a proponer o un ejercicio para resolver en el centro de clculo. El enunciado cubre todo lo aprendido en el tema a y se va a marcar la divisin entre las dos horas de clase que conlleva, las prcticas de ordenador o a PO-H.1 y PO-H.2. Es conveniente que una vez acabado el ejercicio y en vuestro tiempo de trabajo personal deis contenido al mismo. Es decir, en clase unicamente nos da tiempo a aprender como ir obteniendo los resultados con gretl. Aunque el profesor va comentando y explicando los resultados. Vosotros y de forma personal debis redactar convenientemente las respuestas de cada apartado. Notar que en e algunos de ellos se incluye la coletilla A realizar en casa por esa razn. Al nal de este tema en o el Anexo 1.2 tenis un resumen de las instrucciones bsicas de gretl para heterocedasticidad que e a podis consultar para realizar las tareas. e Competencias a trabajar en estas sesiones. 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e 3. Utilizar diversas fuentes estad sticas y adquirir destreza en el uso de un software economtrico e para analizar relaciones entre variables econmicas. o Descripcin del chero de datos a utilizar en las sesiones: o Los datos necesarios para la realizacin de este ejercicio se encuentran en el chero EAF01.gdt. Los o datos corresponden a 540 individuos y contienen informacin sobre educacin, trabajo, ingresos y o o 15 . De las variables disponibles, se consideran las siguientes: otras caracter sticas personales EARN IN GS: Ingresos por hora trabajada, en dlares. o
15 Fichero EAEF01.gdt. Fuente: US National Longitudinal Survey of Youth 1979, recogida en Dougherty, Ch. (2006), Introduction to Econometrics, 3rd. Ed., Oxford University Press. Disponible en gretl, pestaa Dougherty. n
87
SARRIKO-ON 04/10
Anlisis de datos a
F EM ALE: Variable cticia con valor 1 si el individuo es mujer, 0 si es hombre. S: Aos de escolarizacin. n o EXP : Experiencia laboral, en aos. n HOU RS: Nmero de horas trabajadas, por semana. u
Prctica de Ordenador PO-H.1 a Trabajos previos: El chero de datos original considera un gran nmero de variables, por ello ser u a aconsejable que creases uno nuevo donde unicamente aparezcan las variables que se consideran. Para ello puedes proceder de la forma siguiente: en la pantalla inicial de gretl y despus de haber abierto e el archivo de datos EAF01.gdt pulsa con el botn derecho del ratn en: o o Guardar datos como formato estndar a Seala las variables a mantener y pulsa Aceptar n Da nombre al nuevo chero de datos. Gurdalo convenientemente. Ya puedes trabajar con el chero a reducido. Por razones de operatividad es necesario que ordenes la muestra de forma creciente con la variable Si . Real zalo.
1. Estima por MCO el siguiente modelo para los ingresos: EARN IN GSi = 1 + 2 F EM ALEi + 3 Si + 4 EXPi + 5 HOU RSi + ui (2.31)
Interpreta los resultados obtenidos en trminos de signicatividad de las variables, signos de e los coecientes estimados y bondad del ajuste (A realizar en casa). Guarda los residuos y sus cuadrados as como los valores de la variable EARN IN GS i . Completa lo siguiente con la salida que se obtiene de gretl: EARN IN GS i (des(M CO )) = ( ... ( R2 = ) ) ... ( EXPi ... ( ) ) F EM ALEi ... ( ) Si (2.32)
HOU RSi
SCR = 88
Cov(2 , 3 ) =
Anlisis de datos a
SARRIKO-ON 04/10
EARN IN GSi
ui
EARN IN GS i
i=1
i=2
i=3
2. Dibuja y comenta el grco de la variable endgena observada y estimada as como los grcos a o a de residuos siguientes: a) Residuos (i,M CO ) frente a EXPi u b) Residuos al cuadrado (2 CO ) frente a Si ui,M 3. Realiza el contraste de Goldfeld y Quandt para el supuesto de que V ar(ui ) = f (Si ), siendo f () una funcin creciente. Para ello, selecciona, por un lado, los valores de Si estrictamente o menores a 13 y, por otro, los valores de Si estrictamente mayores a 14. 4. Realiza el contraste de Breusch-Pagan para el supuesto de que V ar(ui ) = f (0 + 1 Si ). 5. Obtn la estimacin MCO con desviaciones t e o picas robustas al problema planteado. Comenta qu razones hay para utilizarlas y cmo se utilizan (A realizar en casa). e o
2 6. Supongamos que E(ui )2 = aSi siendo a una constante (a > 0). Estima por M nimos Cuadrados Ponderados los coecientes del modelo (2.31). Explica detalladamente cmo se calcula o el estimador de varianza m nima de los coecientes 1 , ..., 5 del modelo (2.31), sin olvidar el criterio de estimacin (A realizar en casa). o Completa los resultados de la estimacin: o
EARN IN GS i (des(..... ))
= ( ... ( )
... ( EXPi ... ( )
F EM ALEi
... ( )
Si
HOU RSi
89
SARRIKO-ON 04/10 Prctica de Ordenador PO-H.2 a
Anlisis de datos a
En esta sesin vamos a continuar trabajando con el chero de datos reducido que creamos en o la prctica de ordenador PO-H.1. La clase comienza revisando los resultados ms importantes a a obtenidos en dicha prctica y continuamos con la solucin de los siguientes apartados: a o 7. En este apartado vamos a comprobar que aplicar el estimador de M nimos Cuadrados Generalizados al modelo original es equivalente a estimar por M nimos Cuadrados Ordinarios el correspondiente modelo transformado. Para ello seguimos considerando el supuesto sobre el comportamiento de la varianza de la perturbacin realizado en el apartado anterior. Escribe o la ecuacin del modelo transformado y obtn los datos ponderados correspondientes a las vao e riables del modelo (2.31). Finalmente, estima por MCO el modelo con los datos ponderados y realiza la comprobacin pedida. o 8. Dibuja los residuos (i,M CO ) frente a F EM ALEi . Comenta el grco obtenido. u a 9. Si pensamos en todos los grcos de residuos realizados podr a amos pensar que una forma funcional adecuada para la varianza de la perturbacin es V ar(ui ) = 1 + 2 F EM ALEi + o 3 Si + 4 EXPi . Estima el modelo bajo este nuevo supuesto. Completa los resultados de la estimacin: o EARN IN GS i (des(..... )) = ( ... ( 10. Contrasta la hiptesis 4 = 25 . o ) ) ... ( EXPi ... ( ) ) F EM ALEi ... ( ) Si
HOU RSi
2.11.
Taller sobre todo lo trabajado en el tema
Los talleres son clases participativas, ello quiere decir que el alumno debe acudir a clase con el ejercicio realizado en su tiempo de trabajo personal. Previamente y con anticipacin suciente se le o habr realizado la debida propuesta. En los talleres se trabaja el aprendizaje cooperativo, luego el a ejercicio debe resolverse en equipo, idealmente en el grupo en que se va a realizar el proyecto. Esto favorece la interrelacin y conocimiento entre los miembros. En los ultimos 15 minutos de clase, o un representante de cada equipo deber exponer al resto de la clase la decisin adoptada por el a o grupo junto a las razones consideradas. Durante la clase se preguntar aleatoriamente y de forma a individual a los alumnos sobre lo realizado. En el tema de heterocedasticidad en general se lleva a cabo un taller. El objetivo del taller es analizar una serie de resultados de la estimacin de varias especicaciones de un modelo o diferentes o estimaciones de la misma especicacin y que el alumno pueda ir practicando la toma de decisiones o y la redaccin apropiada de conclusiones. Por ello vamos a proponer un taller utilizando lo trabajado o 90
Anlisis de datos a
SARRIKO-ON 04/10
en las prcticas de ordenador. De esta forma el alumno ya est familiarizado con el problema en a a concreto. Una hora de trabajo en un taller en clase equivale a dos horas de trabajo personal sobre el mismo. Adems, es necesario que en este tiempo se reexione y redacten los argumentos y conclusiones a a las que se haya llegado en clase. Competencias a trabajar en esta sesin. o 1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e 4. Elaborar en grupos de trabajo y exponer en pblico un proyecto emp u rico, donde se valore adecuadamente los resultados obtenidos del anlisis de un modelo economtrico. a e
Enunciado del taller: Objetivo: Especicar y estimar la funcin de ingresos por hora trabajada. Se propone la o siguiente relacin: o EARNINGSi = 1 + 2 F EM ALEi + 3 Si + 4 EXPi + 5 HOU RSi + ui (2.33)
donde suponemos que las perturbaciones siguen una distribucin normal de media cero. o Informacin: Se dispone de informacin sobre tres especicaciones alternativas y sus correso o pondientes estimaciones, para especicar la relacin entre las siguientes variables: o - Ingresos por hora trabajada, EARN IN GS, en dlares. o - Una variable cticia, F EM ALE, que determina el sexo del individuo. Toma valor 1 si el individuo es mujer, 0 si es hombre. - Los aos de escolarizacin del individuo, S. n o - La experiencia laboral, EXP , en aos. n - El nmero de horas trabajadas por semana, HOU RS. u Procedimiento: Debis analizar la informacin disponible y decidir cul es la especicacin e o a o ms adecuada junto con su correcta estimacin. a o 91
SARRIKO-ON 04/10 ESTIMACION MCO: Los resultados de la estimacin MCO son los siguientes: o
Anlisis de datos a
EARNINGSi = 17, 8361 6, 74458 FEMALEi + 2, 61304 Si (5, 05978) (1, 15363) (0, 22688) (des(M CO )) M CO )W hite ) (6, 06795) (1, 41171) (0, 28563) (des( + 0, 488736 EXPi 0, 07523 HOURSi 0, 13690 (0, 06531) (0, 17326) (0, 10688) R2 = 0, 24746 SCR = 86479, 7 Cov(2 , 3 ) = 0, 0096428 T = 540
Residuos de la regresin (= EARNINGS observada estimada) 100 100
Residuos de la regresin (= EARN observada estimada)
80
80
60
60
residuo
20
residuo 5 10 EXP usq1 con respecto a S (con ajuste mnimocuadrtico) 15 20
40
40
20
20
20
40
40 6 8 10 12 S 14 16 18 20
9000 Y = 514, + 49,3X 8000 7000 6000 5000 usq1 4000 3000 2000 1000 0 1000 6 8 10 12 S 14 16 18 20
Adems, se dispone de las siguientes regresiones auxiliares: a u2 = 514, 322 + 49, 33Si + 1i i
u2 i uu
SCR = 2, 46476 + 008 R2 = 0, 03360 (A) SCR = 0, 0329 R2 = 0, 0336 R2 = 0, 0336 (B) (C)
= 0,0059 + 0, 00057Si + 2i
ui ( u/540) u
= 3, 211 + 0, 308Si + 3i SCR = 9610, 24
donde ui son los residuos MCO. 92
Anlisis de datos a
SARRIKO-ON 04/10
1. Debis decidir si esta especicacin junto con su mtodo de estimacin es la ms adecuada. e o e o a Analizar la informacin proporcionada por la regresin (2.33) junto con los grcos y las o o a posibilidades, (TODAS), que os ofrecen las regresiones A a C.
ESTIMACION MCG: Dados los resultados analizados en el apartado anterior se propone estimar la ecuacin (2.33) por o M nimos Cuadrados Generalizados y se obtienen los siguientes resultados: Estimaciones MC.Ponderados utilizando las 540 observaciones 1540 Variable dependiente: EARNINGS Variable utilizada como ponderacin: S 2 o Variable const FEMALE S EXP HOURS Coeciente 13,3666 8,4725 2,7514 0,3994 0,1746 Desv. t pica 6,0182 1,3163 0,2560 0,1640 0,0715 Estad stico t 2,2210 6,4366 10,7466 2,4344 2,4429 valor p 0,0268 0,0000 0,0000 0,0152 0,0149
Estad sticos basados en los datos ponderados: Suma de cuad. residuos R2 21920498 0,244486 D.T. de la regresin o F (4, 535) 202,4176 43,28177
1. Debis decidir si esta especicacin junto con su mtodo de estimacin es la ms adecuada. e o e o a Analizar la informacin proporcionada y en particular deber razonar sobre la adecuacin de o ais o la ponderacin utilizada. Qu podis decir acerca de la abilidad de los resultados mostrados? o e e A qu conclusiones llegis? e a
ESTIMACION MCGF: Dados los siguientes resultados: Estimaciones MCO utilizando las 540 observaciones 1540 2 Variable dependiente: i Variable const FEMALE S EXP Coeciente 1,3610 0,6939 0,2524 0,0771 Desv. t pica 0,8162 0,1995 0,0406 0,0244 Estad stico t 1,6675 3,4780 6,2137 3,1584 valor p 0,0960 0,0005 0,0000 0,0017
93
SARRIKO-ON 04/10
Anlisis de datos a
Estimaciones MC.Ponderados utilizando las 540 observaciones 1540 Variable dependiente: EARNINGS 1 Variable utilizada como ponderacin: 2 o i Variable const FEMALE S EXP HOURS Coeciente 12,4753 5,8871 2,1640 0,3798 0,0219 Desv. t pica 3,9112 1,0521 0,1866 0,1090 0,0561 Estad stico t 3,1896 5,5951 11,5961 3,4831 0,3903 valor p 0,0015 0,0000 0,0000 0,0005 0,6964
1. Analizar la informacin proporcionada por los resultados de la estimacin. Consejo: empezar o o por escribir la funcin de regresin poblacional que se est estimando e indicar cules son o o a a los supuestos sobre la perturbacin que se han asumido. Analizar su coherencia dada TODA o la informacin disponible hasta este momento. Finalmente, tomad una decisin sobre si esta o o especicacin junto con su mtodo de estimacin es adecuada. o e o 2. Si tuvieseis que escoger entre las alternativas de estimacin empleadas para estimar el modelo o (2.33), cul escoger a ais? Razonar la respuesta. (A realizar en casa)
2.12.
Evaluativas - Preguntas Cortas
Dado que el curso contempla la evaluacin continua es necesario que a lo largo del tema se evale o u en el d a d a los alumnos. Por ello se realizan pruebas en forma de preguntas cortas. Se pueden a a realizar tanto en las clases magistrales como en las prcticas de aula u ordenador. Se llevan a cabo a en clase y de manera individual. A modo de ejemplo se incluyen las siguientes. Preguntas cortas en Clase Magistral: En el modelo: Yi = 1 + 2 X2i + ui ui N ID 0 , 2 1 X2i i = 1, . . . , 224
donde la matriz de regresores X es no estocstica. a Pc1. Completa las siguientes matrices: E(u) = ... ... ... . . . ... E(uu ) =
... ... ... ... ... ... . . . . . . ... ...
... ... ... . . .
... ... ... ... ... ... . .. . . . ... ... ...
Pc2. Es constante la varianza de la perturbacin a lo largo de la muestra? De qu depende? o e 94
Anlisis de datos a
SARRIKO-ON 04/10
Pc3. Por qu mtodo estimar los coecientes del modelo? Razona tu decisin en base a las e e as o propiedades del estimador. Pc4. Si quisieras estimar el modelo por MCP, cmo debes ponderar las observaciones? Escribe la o ponderacin que utilizar o as. Pc5. Escribe el correspondiente modelo transformado con perturbaciones esfricas y obtn la vae e rianza de la perturbacin de dicho modelo. o Pc6. Escribe expl citamente la frmula del estimador eciente e indica cmo son cada uno de sus o o componentes. Preguntas cortas en Prctica de Aula: a Se realiza un estudio de la funcin de ahorro familiar para lo cual se especica el siguiente modelo: o SAV Ei = 1 + 2 IN COM Ei + 3 SIZEi + ui , donde SAV E: ahorro familiar en dlares en el ao 1970. o n IN COM E: renta familiar total en dlares en el ao 1970. o n SIZE: nmero de miembros de la familia. u Los resultados de la estimacin del modelo (2.34) por MCO son o SAV E i (des(i,M CO )) = 256, 831 + 0, 148 IN COM Ei + 82, 572 SIZEi (1200,88) (0,058) (217,292) R2 = 0, 0635 (2.35) i = 1, . . . , 100 (2.34)
donde des(i,M CO ) ha sido obtenida en el estimador V (M CO ) = 2 (X X)1 . Se dispone de los siguientes grcos de los residuos MCO en funcin de IN COM Ei y SIZEi junto a o uu . las regresiones auxiliares (2.36) y (2.37), donde 2 = 97 u2 i 2 u2 i 2
= 0, 0546 + 0, 000095 IN COM Ei = 0, 3589 + 0, 3123 SIZEi
SCE = 27, 91
(2.36) (2.37)
SCE = 21, 54
Pc1. Utilizando los grcos y las regresiones (2.36) y (2.37), contrasta la posible existencia de a heterocedasticidad en el modelo (2.34) y propn una forma funcional razonable para V ar(ui ). o Justica tu eleccin en base a toda la informacin disponible. o o Pc2. Cmo podr realizar un contraste vlido sobre la signicatividad de la variable IN COM Ei o as a utilizando M CO ? Qu resultados mostrados en (2.35) debes variar y por qu? e e 95
SARRIKO-ON 04/10
Anlisis de datos a
Figura 2.15: Residuos MCO versus variables independientes

Residuos de la regresin (= sav observada estimada) 25000 25000 Residuos de la regresin (= sav observada estimada)
20000
20000
15000
15000
residuos MCO
10000
residuos MCO
10000
5000
5000
5000
5000
10000 0 5000 10000 15000 income 20000 25000 30000
10000 2 3 4 5 6 size 7 8 9 10
2 Pc3. Supn que V ar(ui ) = 2 IN COM Ei , Cov(ui , uj ) = 0, i = j. o
a) Completa la expresin del criterio de estimacin utilizado en el apartado anterior: o o

100
M in
. . . . . . (Yi . . . . . . . . . . . . . . . . . . . . . . . .)2
i=1
b) Qu tiene en cuenta el criterio de estimacin de MCG que no tiene en cuenta el criterio e o de MCO? Razona y explica tu respuesta. Preguntas cortas en Prctica de Ordenador: a Accede al conjunto de datos data8-3.gdt del libro de Ramanathan incluido en gretl16 . En este chero vas a encontrar datos de las siguientes variables: el gasto sanitario agregado en billones de dlares (exphlth), la renta personal disponible agregada tambin en billones de dlares o e o (income), el porcentaje de poblacin que supera los 65 aos en el ao 2005 (seniors) y la poblacin o n n o en millones (pop). Para el modelo: exphlthi = 1 + 2 incomei + 3 seniorsi + ui i = 1, . . . , 51
Pc1. Contrasta la posibilidad de que V ar(ui ) = 2 pop2 utilizando el estad stico de Breusch-Pagan i y completa: a) H0 : Ha :
b) Estad stico de contraste y distribucin: o
16 Fichero data8-3.gdt, disponible en gretl pestaa Ramanathan. Recogido en Ramanathan, R. (2002), Introductory n Econometrics with Applications, 5th. edn., South-Western.
96
Anlisis de datos a c) Regresin auxiliar: o
SARRIKO-ON 04/10
d ) Regresin auxiliar estimada: o
e) Computa el estad stico de contraste y lleva a cabo el contraste: Pc2. Suponiendo V ar(ui ) = 2 pop2 estima adecuadamente el modelo y razona las propiedades del i estimador utilizado. Pc3. Contrasta utilizando el estimador MCO de los coecientes y de forma vlida la signicatividad a individual de las variables income y seniors. Contrasta la signicatividad conjunta.
97
SARRIKO-ON 04/10
Anlisis de datos a
2.13.
Referencias Bibliogrcas Bsicas: a a Terica: o [1] Greene, W. (1998), Anlisis Economtrico, ed. Prentice Hall, 3a edition. a e [2] Ramanathan, R. (2002), Introductory Econometrics with applications, ed. South-Western, 5th edition. [3] Wooldridge, J. M. (2003), Introductory Econometrics: A modern Approach, ed. South-Western, 2nd edition. Ejercicios: [1] Fernndez, A., Gonzlez, P., Reglez, M., Moral, P., Esteban, V. (2005), Ejercicios de Econoa a u a edicin. metr ed. McGraw-Hill, 2 a, o [2] Recopilacin de ejercicios recomendados y exmenes de Econometr Departamento de Econom o a a. a Aplicada III (Econometr y Estad a stica). Mimeo Febrero 2009. Ejercicios con gretl: [1] Ramanathan, R. (2002), Instructors Manual to accompany, del libro Introductory Econometrics with applications, ed. South-Western, 5th edition, Harcourt College Publishers. [2] Wooldridge, J. M. (2003), Student Solutions Manual, del libro Introductory Econometrics: A modern Approach, ed. South-Western, 2nd edition. Referencias Bibliogrcas Complementarias: a [1] Alonso, A., Fernndez, J. y Gallastegui, I. (2005), Econometr ed. Pearson: Prentice Hall. a a, [2] Breusch, T. S. y Pagan, A. R. (1979), A Simple Test for Heteroscedasticity and Random Coefcient Variation, Econometrica, 47, pp. 1287-1294. [3] Dougherty, Ch. (2006), Introduction to Econometrics, 3rd. Ed., Oxford University Press. [4] Goldfeld, S. M. y Quandt, R. E. (1965), Some Test for Homoscedasticity, Journal of the American Statistical Association, 60, pp. 539-547. [5] Gujarati, D. (2004), Econometr ed. McGraw-Hill, 4a edicin. [6] Harvey, A., y Phillips, G. a, o (1974), A Comparison of the Power of Some Test for Heteroscedasticity in the General Linear Model, Journal of Econometrics, 2, pp. 307-316. [7] Johnston, J. (1984), Mtodos de Econometr ed. Vicens Vivens, 4a edicin. e a, o [8] Maddala, G. S. (1996), Introduccin a la Econometr ed. Pearson: Prentice Hall. o a, [9] Novales, A. (1993), Econometr ed. McGraw-Hill, 2a edicin. a, o [10] White, H. (1980), A heteroskedasticity-Consistent Covariance Matrix Estimator and a Direct Test for Heteroskedasticity, Econometrica, 48, pp. 817-838.
98
Anlisis de datos a
SARRIKO-ON 04/10
2.14.
Anexo 1.1: Resultados de gretl utilizados en las clases magistrales
Resultado 1: Estimacin por MCO: o Estimaciones MCO utilizando las 40 observaciones 140 Variable dependiente: consumo Coeciente const renta 40,7676 0,1282 Desv. t pica 22,1387 0,0305 estad stico t 1,8415 4,2008 130,3130 45,1586 54311,30 37,8054 0,3171 0,2991 38 valor p 0,0734 0,0002
Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o R2 R2 corregido Grados de libertad
Resultado 2: Regresiones parciales para computar el estad stico de Goldfeld y Quandt:
Estimaciones MCO utilizando las 20 observaciones 120 Variable dependiente: consumo Coeciente const renta 12,9388 0,1823 Desv. t pica 28,9666 0,0520 estad stico t 0,4467 3,5023 112,3040 32,9714 12284,2 26,1238 0,4052 0,3722 18 valor p 0,6604 0,0025
Estimaciones MCO utilizando las 20 observaciones 2140 Variable dependiente: consumo Coeciente const renta 48,1767 0,1176 Desv. t pica 70,2419 0,0815 99 estad stico t 0,6859 1,4425 valor p 0,5015 0,1663
SARRIKO-ON 04/10 Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o R2 R2 corregido Grados de libertad 148,322 49,1527 41146,9 47,8115 0,1036 0,0538 18
Anlisis de datos a
Resultado 3: Regresin auxiliar para computar el estad o stico de Breusch Pagan: Estimaciones MCO utilizando las 40 observaciones 140 Variable dependiente: enorm Coeciente const renta 1,6788 0,0038 Desv. t pica 0,6876 0,0009 estad stico t 2,4415 4,0461 1,0000 1,3864 52,3940 1,1742 0,3010 0,2827 38 valor p 0,0194 0,0002
Resultado 4: Estimacin por MCP: o Estimaciones MC.Ponderados utilizando las 40 observaciones 140 Variable dependiente: consumo Variable utilizada como ponderacin: 1/renta o Coeciente const renta 31,9244 0,1409 Desv. t pica 17,9861 0,0269 estad stico t 1,7749 5,2216 valor p 0,0839 0,0000
Estad sticos basados en los datos ponderados: Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o 2 R R2 corregido Grados de libertad 68,7020 1,3446 0,4177 0,4024 38
100
Anlisis de datos a Estad sticos basados en los datos originales: Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o 130,313 45,1586 54557,3 37,8909
SARRIKO-ON 04/10
Resultado 5: Regresin auxiliar para el estimador de MCGF: o Estimaciones MCO utilizando las 40 observaciones 140 Variable dependiente: u2 CO i,M Coeciente const renta sq renta 1923,6000 7,4202 0,0087 Desv. t pica 2365,4800 6,6882 0,0045 estad stico t 0,8132 1,1094 1,9221 1357,78 1882,48 8,78226e+07 1540,64 0,3645 0,3302 10,6133 0,0002 valor p 0,4213 0,2744 0,0623
Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o 2 R R2 corregido F (2, 37) valor p para F () Estimacin por MCGF: o
Estimaciones MC.Ponderados utilizando las 40 observaciones 140 Variable dependiente: consumo Variable utilizada como ponderacin: i o 2 Coeciente const renta 34,2386 0,1410 Desv. t pica 17,6042 0,0289 estad stico t 1,9449 4,8757 valor p 0,0592 0,0000
Estad sticos basados en los datos ponderados: Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o R2 R2 corregido Grados de libertad 101 39,3094 1,0170 0,3848 0,3686 38
SARRIKO-ON 04/10 Estad sticos basados en los datos originales: Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o 130,3130 45,1586 54793,9 37,9730
Anlisis de datos a
Resultado 6: Estimacin de White de V (M CO ): o Estimaciones MCO utilizando las 40 observaciones 140 Variable dependiente: consumo Desviaciones t picas robustas ante heterocedasticidad, variante HC3 Coeciente const renta 40,7676 0,1282 Desv. t pica 27,3213 0,0439 estad stico t 1,4922 2,9168 130,3130 45,1586 54311,3 37,8054 0,3171 0,2991 38 valor p 0,1439 0,0059
102
Anlisis de datos a
SARRIKO-ON 04/10
2.15.
Anexo 1.2: Instrucciones bsicas de gretl para heterocedasticidad a
En las clases del Centro de Clculo o Laboratorio Informtico nuestro objetivo es aprender el maa a nejo de un software libre especialmente indicado y creado para el aprendizaje de la Econometr a. Es un software muy sencillo en el que podis ser autodidactas. Sin embargo, vamos a comenzar e con un recordatorio de las nociones bsicas que ya se han visto en Introduccin a la Economea o tr A continuacin se pasar a mostrar las instrucciones espec a. o a cas ms usuales para el caso de a heterocedasticidad.
Comienzo de la sesin. Conexin y lectura de datos: o o Encender el terminal Hacer click cuando lo pide Introducir login y password donde lo pide. Introducir el pendrive o diskette. Si pensis guardar los resultados en un documento Word. Pulsar: a Inicio Todos los programas Microsoft Oce Microsoft Oce Word. As estamos abriendo un documento en Word para ir guardando los resultados17 . Minimizaremos la ventana del documento .doc ( .tex) si es el caso para usarlo cuando haya o resultados que guardar. Pulsar Inicio Todos los programas gretl Ya estamos dentro de gretl y veremos una ventana con diferentes opciones que podemos utilizar. En el Centro de Clculo de la Facultad los resultados van a una carpeta compartida que a est previamente creada, pero en nuestro PC necesitaremos guardar los resultados en una a carpeta donde previamente hemos abierto el documento Word, Tex, etc. Por lo tanto, lo primero que haremos ser predeterminar el destino. Pulsar: a Archivo Preferencias General En la ventana Directorio gretl de usuario buscaremos la situacin de la carpeta citada o Pulsar Aceptar Para leer los datos de la tarea. Pulsar: Archivo Abrir datos Archivo de muestra Nombre del chero de datos por ejemplo Ramanathan data7-24.gdt Aparecern las variables de la muestra y en la barra superior diferentes etiquetas, por ejemplo a en Datos podremos ver las observaciones y sus caracter sticas, en Modelo podremos realizar estimaciones.
Si no dominamos Word podemos guardar los resultados en formato texto para pegar en el block de notas o Notepad. En este caso no crearemos el documento .doc. gretl tambin permite guardar resultados en formato Latex e previo crear el documento .tex de la misma forma que el documento Word con la opcin adecuada. o
17
103
SARRIKO-ON 04/10 Algunas etiquetas de la pantalla principal: La etiqueta Datos: Algunas de las opciones que contiene la etiqueta Datos son las siguientes: Mostrar valores Editar valores Leer informacin o Ver descripcin o Estructura del conjunto de datos
Anlisis de datos a
Para obtener lo que necesitamos, slo tenemos que seleccionar la etiqueta correspondiente y o la variable o variables a estudiar. Por ejemplo, para ver la estructura del conjunto de datos pulsamos en la etiqueta Estructura del conjunto de datos y obtendremos una pantalla en la que aparecer seleccionado el tipo de datos con el que estamos trabajando, en este caso Seccin a o Cruzada seleccionamos Adelante y nos conrma que la muestra es una seccin cruzada junto o con su tamao, 1 a 224 observaciones. n Si la muestra fuese de serie temporal hubiera indicado Serie temporal, seleccionar amos aceptar y ver amos la frecuencia, mensual, y el inicio y nal de la muestra 1968:1 a 1998:12, por ejemplo. La etiqueta estructura del conjunto de datos es muy util cuando necesitamos cambiar alguno de ellos por ejemplo si aadimos nuevas observaciones. n La misma informacin contenida en la estructura del conjunto de datos podemos encontrarla o en la etiqueta: Ver descripcin, que describe el conjunto de datos junto con cada una de las o variables que lo componen. La etiqueta Ver: Se obtienen grcos de las variables y sus estad a sticos principales entre otros. Para obtener los estad sticos principales de las variables de la muestra podemos hacerlo pulsando en: Ver Estad sticos principales La ventana de output mostrar la media, moda, valor mximo y m a a nimo de la serie, desviacin o t pica, coeciente de variacin, curtosis y asimetr para una unica serie o para el conjunto o a, de ellas seleccionndolo previamente. a La etiqueta Variable: Sirve para trabajar con una unica serie de la muestra. Algunas de las opciones que incluye esta etiqueta son: Buscar Mostrar valores Estad sticos principales Distribucin de frecuencias o Grco de frecuencias (simple, contra la normal, contra la gamma) a Grco de series temporales a Editar atributos etc 104
Anlisis de datos a
SARRIKO-ON 04/10
La etiqueta Aadir: n Con esta etiqueta podemos aadir variables o transformaciones de las existentes al conjunto n de datos original, para ello tras pulsar en Aadir tenemos las siguientes posibilidades: n Logaritmos de las variables seleccionadas Cuadrados de las variables seleccionadas Retardos de las variables seleccionadas Primeras diferencias de las variables seleccionadas Diferencias del logaritmo las variables seleccionadas Diferencias estacionales de las variables seleccionadas Variable ndice: index i = 1, . . . , N, index i time t = 1, . . . , T, time t
Tendencia temporal Variable aleatoria (uniforme, normal, chi cuadrado y t-Student) Por ejemplo para crear una variable normal de media 0 y desviacin 1 haremos nombre de la variable 0 1 o Variables cticias, etc. Denir una nueva variable. Esta opcin podemos utilizarla para crear combinaciones de o variables por ejemplo Zt = 4 + t t N (0, 1). Permite los operadores, +, -, *, /, ^
(suma, resta, producto, potencia) entre otros. Para crear un conjunto de datos: Datos no incluidos en gretl: En ocasiones debemos trabajar con un chero de datos que no est incluido en gretl. Podemos a importarlo y trabajar con l con solo que est en alguno de los formatos compatibles con gretl. Para e e ello pulsamos en Archivo Abrir datos importar y seleccionamos el formato adecuado siguiendo la secuencia de rdenes que se nos pida. Esta secuencia va dirigida a denir la muestra, tipo de o datos, longitud, etc. En otras ocasiones debemos crear directamente la muestra en gretl. Para ello debemos crear un nuevo conjunto de datos como sigue: Archivo Nuevo conjunto de datos y completar la informacin que pide sobre: o nmero de observaciones u estructura del conjunto de datos (serie temporal o seccin cruzada) o frecuencia observacin inicial o A la pregunta Desea empezar a introducir los valores de los datos usando la hoja de clculo de a gretl? contestar S 105
SARRIKO-ON 04/10
Anlisis de datos a
Introducir el nombre de la variable. El mximo de caracteres que acepta es 15, no usar acentos a ni la letra n. Pulsar Aceptar En la hoja de clculo situarnos en la primera celda y teclear la observacin correspondiente, a o a continuacin pulsar intro. Si nos saltamos alguna observacin podemos insertar una la en o o o el lugar correspondiente con solo situarnos en la celda posterior e ir a observacin insertar obs. Una vez introducidas todas las variables pulsar Aplicar. Para guardar los datos: en men Archivo Guardar datos. Dar nombre al conjunto de datos, u por ejemplo Azar y se grabar automticamente con la extensin gdt. a a o Si en otro momento queremos usar este conjunto de datos slo habr que pulsar el botn izquierdo o a o del ratn dos veces para que se active. o Un repaso a lo ms bsico: a a Estimacin MCO: Modelo M o nimos Cuadrados Ordinarios Seleccionar la variable endgena y exgenas mediante el siguiente proceso: o o 1. Variable endgena, pulsar nombre de la variable dependiente Elegir o 2. Elegir los regresores, pulsar Aadir con cada una. Por defecto tendremos predeterminada una n constante que se puede eliminar si es necesario. Para realizar la regresin pulsar Aceptar. o Se muestran los resultados de la estimacin y diferentes estad o sticos. Las desviaciones t picas son 2 (X X)1 . calculadas con la expresin o Notar que en la ventana abierta por MCO, abajo a la izquierda aparece una casilla con la leyenda estimaciones t picas robustas. En principio no debe estar activada. Corresponden a la estimacin o consistente de la matriz de varianzas y covarianzas de los estimadores MCO como veremos ms a adelante. En la ventana de resultados de la estimacin MCO tenemos diferentes opciones, podemos o hacer contrastes, grcos etc. a Para guardar los resultados en formato word: Editar Elegir formato RTF(Ms Word). Abrir el documento Word creado anteriormente. Seleccionar: Edicin Pegar Guardar Minimizar ventana18 o Grcos de residuos: a Tenemos varias posibilidades para dibujar los residuos, podemos dibujar su evolucin en la muestra o o contra alguna de las variables exgenas de la muestra, dependiendo de lo que nos interese. Partimos o de la ventana de resultados MCO: 1. Evolucin de los residuos: o a) si la muestra es de serie temporal: Grcos Grco de residuos contra el tiempo a a
18
Para guardarlo en Latex, .tex, o modo texto, .txt, proceder igual con la opcin adecuada. o
106
Anlisis de datos a b) si la muestra es de seccin cruzada: o Grcos Grco de residuos por observacin a a o 2. Grco de residuos frente a alguno de los regresores: a Grcos Grco de residuos contra nombre del regresor a a
SARRIKO-ON 04/10
3. Para dibujar los residuos frente a una variable incluida en el chero de datos, pero que no sea uno de los regresores debemos situarnos en la pantalla inicial de gretl y seguir la secuencia: Datos Grcos Grco X-Y scatter seleccionar X e Y adecuadamente a a Para guardar grcos: pulsar con el botn derecho del ratn en cualquier parte del grco y a o o a elegir la opcin en que queremos que nos lo guarde, por ejemplo postcript (.eps) o cualquier otra o que nos convenga. En la ventana que aparece indicarle donde queremos que nos lo guarde. Para ver el grco variable ajustada-observada: a Grcos Grco de ajustada-observada elegir por nmero de observacin (si es una muestra a a u o de seccin cruzada) o frente al tiempo (si la muestra es de serie temporal) o Para ver el grco variable ajustada-observada frente a alguno de los regresores: a Grcos Grco de ajustada-observada contra nombre del regresor a a Podemos guardar los datos de la variable endgena estimada, los residuos y los residuos al cuadrado o que posiblemente, necesitemos despus. En la pantalla de resultados de la estimacin: e o Guardar valores ajustados Guardar residuos Guardar residuos al cuadrado entre otros. gretl los va a aadir al conjunto de datos con el que trabajamos y los denota respecn tivamente por yhat1, uhat1 e usq1 respectivamente, donde 1 indica que corresponde al modelo 1, as que si lo buscis para el modelo que habis estimado en tercer lugar los llamara uhat3. Adems, a e a aade una leyenda explicativa de la variable. Como veis en la pestaa hay otros estad n n sticos que se pueden guardar de la misma forma por ejemplo la suma residual de cuadrados por ejemplo, ess1, etc. Tambin podemos hacer nuevas estimaciones o aadir variables explicativas a la anterior repitiendo e n los pasos anteriores. Instrucciones de gretl espec cas para heterocedasticidad Contrastes de heterocedasticidad: gretl tiene implementados diferentes contrastes de heterocedasticidad. Por ejemplo el contraste de White o el contraste de Breusch-Pagan. Ambos se encuentran en la pantalla de resultados de la estimacin MCO. Pulsar: o 107
SARRIKO-ON 04/10 Contrastes Heterocedasticidad seleccionar el contraste deseado
Anlisis de datos a
Por supuesto ambos los podis realizar siguiendo expl e citamente todos los pasos aprendidos en clase. De la misma forma se puede llevar a cabo el contraste de Goldfeld y Quandt. Veamos como realizar el contraste de Breusch-Pagan. Contraste de Breusch-Pagan: Para computar la regresin auxiliar para el contraste de Breusch-Pagan hemos de guardar en primer o lugar, los cuadrados de los residuos MCO y la SCR del modelo de inters. A continuacin hemos de e o denir la variable endgena de la regresin auxiliar, los residuos normalizados, que hemos llamado o o 2 = u2 2 , para ello en: ei i,M CO / Variable Denir una nueva variable introducir la frmula e2 = usq1/(ess1/N ) con los valores que previamente habis guardados o o e 19 . A continuacin estimis la anotado de la suma de cuadrados residual y el tamao muestral n o a regresin auxiliar por MCO de la manera habitual y anotar los estad o sticos necesarios para computar el test. Contraste de Goldfeld y Quandt: En el contraste de Goldfeld y Quandt se supone que la varianza de la perturbacin es montonao o mente creciente (o decreciente) con una variable cuyos valores son conocidos. Es necesario ordenar la muestra conforme al crecimiento (decrecimiento) de esa variable. Para ello podemos seguir la siguiente secuencia desde la pantalla inicial: Datos ordenar seleccionar la variable por cuyo crecimiento o decrecimiento queremos ordenar la muestra seleccionar el criterio, creciente o decreciente Adems, es necesario que la muestra se divida en dos submuestras dejando un nmero de observacioa u nes centrales que de independencia a ambas submuestras. A continuacin se realiza la regresin MCO o o en ambas submuestras y se aplica el estad stico de contraste. La unica dicultad de este test es dividir la muestra. Para ello debemos seguir la siguiente secuencia de rdenes partiendo de la pantalla princio Muestra seleccionar rango restringir a partir de un criterio pal de gretl. Seleccionar, segn el criterio adecuado: u denir a partir de una variable cticia con ello hemos restringido la muestra y podemos realizar la regresin en dicha submuestra. Tomar o nota de los estad sticos necesarios. A continuacin hay que recuperar el rango completo antes de o volver a restringir la muestra para crear la segunda submuestra. Pulsar: Muestra recuperar rango completo volver a restringir la muestra para realizar la segunda regresin y tomar nota de los datos necesarios o para realizar el contraste. Antes de seguir trabajando recordar recuperar el rango completo de la muestra.
19
Se ha denotado u2 CO =usq1 y 2 =ess1/N. i,M
108
Anlisis de datos a
SARRIKO-ON 04/10
Los contraste de Goldfeld- Quandt y Breusch-Pagan no son los unicos posibles. De hecho gretl ofrece la posibilidad de contrastar heterocedasticidad usando el test de White y una variante del mismo como habis podido ver al desplegar la pestaa Contrastes Heterocedasticidad sin eme n bargo, en los contenidos del tema no se suele incluir este contraste ya que el tiempo disponible es limitado. Estimador de White: El estimador de White es el estimador consistente de la matriz de varianzas y covarianzas de los parmetros estimados por MCO, V (M CO ). Lgicamente ha de encontrarse dentro de la estimacin a o o MCO y ya lo hemos abordado antes, estaba en la ventana abierta por MCO. Abajo a la izquierda aparece una casilla con la leyenda estimaciones t picas robustas. Corresponden a la estimacin cono sistente de la matriz de varianzas y covarianzas de los estimadores MCO a la White. Si deseamos esta estimacin haremos click en la casilla. Pulsar en congurar y elegir HC3a que es la correspono diente al estimador visto en clase. M nimos Cuadrados Generalizados o Ponderados (MCP) Bajo MCP gretl implementa el estimador de MCG v MCO en el modelo transformado. a Lo primero que va a necesitar gretl es conocer la ponderacin por ello, si la ponderacin no es una o o variable previamente denida, debis denirla de la forma habitual: e Variable Denir una nueva variable introducir la frmula o Una vez que tenis construida la ponderacin para estimar por MCP seleccionamos: e o Modelo otros modelos lineales m nimos cuadrados ponderados Se eligen adecuadamente la variable dependiente, las independientes y la ponderacin seleccionando o y aadiendo de la forma habitual. n Con la denicin de la variable de ponderacin hay que tener un poco de cuidado ya que es necesario o o adecuarse a la forma que utiliza el programa para construir las variables en el modelo transformado. As para diferentes versiones hace diferentes cosas y necesitamos saber a ciencia cierta cmo cons o truye el modelo transformado a partir de la denicin de la variable de ponderacin. Lo sabemos o o en la pestaa Ayuda, dentro de M n nimos Cuadrados Ponderados dependiendo de la versin. Por o ejemplo para la versin 1.7.1, incluye la siguiente leyenda en ingls20 : o e Weighted Least Squares If wtvaris a dummy variable, WLS estimation is equivalent to eliminating all observations with value zero for wtvar. Let wtvardenote the variable selected in the Weight variablebox. An OLS regression is run, where the dependent variable is the product of the positive square root of wtvar and the selected dependent variable, and the independent variables are also multiplied by the square root of wtvar. Statistics such as R-squared are based on the weighted data. If wtvar is a dummy variable, weighted least squares estimation is equivalent to eliminating all observations with value zero for wtvar.
20
Las etiquetas de ayuda estn en ingls ya que no se traducen como el resto del programa. a e
109
SARRIKO-ON 04/10
Anlisis de datos a
Donde wtvardenota la variable de ponderacin y el modelo transformado se construye multiplicano do la ra cuadrada de wtvar por cada variable del modelo original incluida la constante. Por ejemz 1 2 plo si suponemos que V ar(ui ) = 2 X2i tomaremos como ponderacin a X 2 y si V ar(ui ) = 2 X2i o tomaremos como ponderacin a o
1 X2i .
2i
M nimos Cuadrados Generalizados Factibles 1. Primero hemos de pensar en la forma funcional de la varianza. Supongamos que la forma funcional de la varianza que vamos a proponer es:
2 V ar(ui ) = i = 1 + 2 W1i + 3 W2i
A continuacin hemos de crear la regresin auxiliar y estimarla por MCO. Si la variable o o endgena son los residuos MCO al cuadrado del modelo de inters y los hemos guardado o e podemos utilizarlos directamente y si no lo hemos hecho elevaremos al cuadrado los residuos MCO guardados en la estimacin MCO original. Estimamos la regresin auxiliar y guardamos o o las estimaciones de la variable endgena de esta regresin. Con esta serie construiremos la o o ponderacin, es decir, vamos a obtener i por lo que debemos comprobar que es siempre o 2 positiva. 2. Construimos la ponderacin 1/i y la aadimos al conjunto de datos usando como habitualo 2 n mente Variable Denir una nueva variable introducir la frmula o 3. A continuacin seleccionamos: o Modelo M nimos Cuadrados Ponderados y la variable dependiente, las independientes y la ponderacin seleccionando y aadiendo de o n la forma habitual. Este modo de proceder proporciona el estimador de MCGF.
110
Tema 3
Autocorrelacin o
Clases Magistrales
Habitualmente se dedican a este tema seis clases magistrales. En estas clases el profesor ilustra al alumno otra situacin habitual en la prctica cuando en el anlisis economtrico se dispone de o a a e datos de las variables observadas a lo largo del tiempo. El alumno ya est familiarizado en l a neas generales con el problema economtrico, ya que se enclava dentro del marco del modelo de regresin e o lineal con perturbaciones no esfricas. Por lo tanto, en el Tema 1 sobre M e nimos Cuadrados Generalizados, el alumno ya ha visto las consecuencias de tener este marco de anlisis en trminos de a e estimacin e inferencia. En el tema anterior ya han sido aplicadas estas tcnicas en el caso concreto o e de heterocedasticidad y la estructura ser bastante similar. Se comenzar con la introduccin del a a o concepto de autocorrelacin y se estudiarn dos modelos concretos para modelar la autocorrelacin: o a o los procesos autorregresivos y los de medias mviles. Seguidamente se dedicarn varias clases a o a explicar y a ilustrar con varios ejemplos la utilizacin del anlisis grco de los residuos y a dos o a a contrastes de autocorrelacin: el contraste de Durbin-Watson y el contraste de Breusch-Godfrey. o Las ultimas clases magistrales se dedicarn a ver aplicado a este contexto varios procedimientos de a estimacin e inferencia por M o nimos Cuadrados Generalizados Factibles junto a las consecuencias de estimar por M nimos Cuadrados Ordinarios y una forma alternativa de realizar la inferencia con este estimador. A lo largo de las clases magistrales se pedir al alumno adems, de la lectura de las a a notas sobre el tema, la realizacin de diversos ejercicios que se resolvern en clase. Para conocer el o a grado de seguimiento del alumno, se podrn realizar en clase preguntas cortas a resolver. a Competencias a trabajar en estas sesiones: 1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e
111
SARRIKO-ON 04/10 Al nal de este tema deber ais ser capaces de:
Anlisis de datos a
1. Explicar que se entiende por un modelo de regresin lineal con autocorrelacin, cmo modelizar o o o esta caracter stica en el trmino de perturbacin del modelo y sus implicaciones en su matriz e o de varianzas y covarianzas. 2. Saber analizar grcamente la posible existencia de autocorrelacin y otros problemas de a o especicacin. o 3. Utilizar lo contrastes de Durbin-Watson y Breusch-Godfrey para contrastar la posible existencia de autocorrelacin. o 4. Describir y comparar las propiedades de los estimadores MCO y MCG bajo autocorrelacin. o 5. Transformar un modelo con un trmino de error que sigue un AR(1) en otro cuyo trmino de e e perturbacin es un ruido blanco. o 6. Estimar y hacer inferencia por MCG o MCGF bajo el supuesto de que el trmino de error del e modelo de regresin sigue un proceso AR(1). o 7. Razonar por qu resulta conveniente disponer de un estimador consistente de la matriz de e varianzas y covarianzas de los estimadores de MCO en presencia de autocorrelacin. Saber o utilizar dicho estimador en el contexto adecuado. Bibliograf Recomendada: a Al nal del tema tenis recogida la bibliograf correspondiente. En particular os recomendamos e a leer los cap tulos correspondientes a la bibliograf bsica detallados a continuacin: a a o Greene, W. (1998), cap. 13. Ramanathan, R. (2002), cap. 9. Wooldridge, J. M. (2003), cap. 11 y cap. 12. Y para profundizar, podis leer los cap e tulos detallados a continuacin correspondientes a la biblioo graf complementaria: a Alonso, A. y otros (2005), cap.10. Gujarati, D. (2004), cap.12. Johnston, J. (1984), cap. 8. Maddala, G. S. (1996), cap. 6. Novales, A. (1993), cap. 5 y cap. 7. Pindyck R. S. y Rubinfeld, D. L. (1998), cap. 6.
112
Anlisis de datos a
SARRIKO-ON 04/10
3.1.
El concepto de autocorrelacin y su modelizacin o o
3.1.1.
Introduccin o
Este tema aborda el problema de autocorrelacin, una caracter o stica que puede presentar el trmino e de error de un modelo economtrico y que se maniesta con mayor frecuencia al tratar con datos e observados a lo largo del tiempo. Este tipo de datos, llamados datos de series temporales, son observaciones de una variable recogidas a lo largo del tiempo (d meses, trimestres, aos etc.) as, n de cierta unidad econmica (empresa, consumidor, regin, pa etc.). Estos datos presentan un o o s ordenamiento natural, ya que las observaciones estn ordenadas de acuerdo al momento del tiempo a en que han sido observadas. Es probable que a la hora de explicar el comportamiento de una variable observada en el tiempo, se tenga que tener en cuenta que sus observaciones puedan estar correlacionadas a lo largo del mismo. Por ejemplo, el consumo de una familia en un ao es probable que est correlacionada con el consumo n e del ao anterior ya que en media, ceteris paribus, esperar n amos que una familia no cambiara mucho su comportamiento en su consumo de un ao a otro. Esto implicar posiblemente, introducir en n a el modelo para explicar el consumo de un ao, por ejemplo, el consumo del ao anterior. Tambin n n e podemos considerar que un cambio en el nivel de una variable explicativa, por ejemplo la renta de esa familia en un ao, tenga efectos sobre el consumo en aos sucesivos. Una forma de tener en n n cuenta esto ser introducir como variable explicativa del consumo en un ao no slo la renta de ese a n o ao, sino la renta de aos anteriores. n n Finalmente, adems de factores observables cuya inuencia en el consumo se distribuye a lo largo del a tiempo, podemos tener factores no observables recogidos en el trmino de perturbacin del modelo e o cuya inuencia se mantiene durante varios periodos presentando lo que se llama autocorrelacin o o correlacin serial en el tiempo. o Como vemos, hay distintas formas de introducir en un modelo efectos que se distribuyen a lo largo del tiempo. Podemos introducir retardos tanto de la variable endgena, por ejemplo Yt1 , como o de ciertas variables explicativas, Xtj , j = 1, . . . , J, o modelar el trmino de error ut en funcin e o por ejemplo de su propio pasado utj , j = 1, . . . , p. Esto es, lo que se conoce como especicacin o dinmica del modelo. En muchos casos es necesario reexionar sobre esta especicacin y saber a o asignar a qu parte, sistemtica o de perturbacin, corresponde. Una mala especicacin dinmica o e a o o a simplemente funcional de la parte sistemtica de un modelo, puede llevar a detectar autocorrelacin a o en el trmino de perturbacin. e o En este tema estudiaremos cmo detectar la presencia de correlacin serial en el trmino de error, o o e analizar cul puede ser la fuente de este problema y si no es un problema de mala especicacin, a o cmo recoger en el modelo esta caracter o stica dinmica en el trmino de error. Tambin estudiaremos a e e las implicaciones de la existencia de autocorrelacin en los mtodos de estimacin alternativos y en o e o los contrastes de hiptesis sobre los parmetros de inters del modelo. En un tema posterior nos o a e ocuparemos de la dinmica en la parte sistemtica. a a 113
SARRIKO-ON 04/10
Anlisis de datos a
3.1.2.
Procesos Autorregresivos y de Medias Mviles o
Normalmente se considera como autocorrelacin en el trmino de error de un modelo correctamente o e especicado en media, al incumplimiento de la hiptesis bsica E(ut us ) = 0 t = s. Esto implica que o a puede existir relacin entre pares de perturbaciones ut , us , de forma que no todas las covarianzas o entre perturbaciones de distintos periodos de tiempo van a ser cero. Una forma de recoger este comportamiento es proponer que las perturbaciones siguen algn tipo de u proceso estocstico, tal que sus realizaciones estn correlacionadas en el tiempo. Vamos a ver dos a a tipos de procesos, los llamados procesos autorregresivos (AR) y los de medias mviles (MA). o En general, un proceso o modelo Autorregresivo de orden p, que denotamos como AR(p), se dene como un modelo de regresin lineal donde la variable dependiente es el trmino de perturbacin y o e o los regresores son sus propias realizaciones pasadas esto es: ut = 1 ut1 + . . . + p utp + t
2 donde t iid(0, ), y se conoce como un ruido blanco. Un proceso o modelo de medias mviles o de orden q, que se denota como MA(q), tambin se representa como un modelo de regresin lineal e o donde la variable dependiente es el trmino de perturbacin, pero los regresores son las realizaciones e o presente y pasadas de la innovacin o ruido blanco t . o
ut = 1 t1 + . . . + q tq + t La combinacin de ambos procesos ser un modelo ARMA(p,q). o a La matriz de varianzas y covarianzas de las perturbaciones, , es distinta para cada proceso y bajo ciertas condiciones depende de pocos parmetros, que sern los coecientes del modelo AR o MA y a a la varianza de t . Lo veremos con dos casos particulares: los procesos AR(1) y MA(1). Proceso AR(1): ut = ut1 + t
2 t (0, ) iid
|| < 1
(3.1)
Es el proceso ms habitual y simple para modelizar autocorrelacin en el trmino de error de a o e un modelo de regresin adecuadamente especicado, en especial cuando los datos son de frecuencia o anual. Sustituyendo recursivamente podemos expresar ut como una combinacin lineal de los valores o pasados y presente de :
ut = ut1 + t = 2 ut2 + t1 + t = =
j=0
j tj
Las propiedades de este proceso son las siguientes:

E(ut ) = E(
j=0
j tj ) =
j=0
j E(tj ) = 0
E(u2 ) = E( t
j=0
j tj )2 =
j=0
2 2j E(2 ) = (1 + 2 + 4 + 6 + . . . ) tj
114
Anlisis de datos a por lo que si || < 1:

2 V ar(ut ) = u = 2 1 2
SARRIKO-ON 04/10
Adems, a
2 E(ut ut1 ) = E[(ut1 + t )ut1 ] = E(u2 ) + E(ut1 t ) = u t1 2 E(ut ut2 ) = E[(ut1 + t )ut2 ] = E(ut1 ut2 ) + E(ut2 t ) = 2 u
En general,
2 E(ut uts ) = s u y por lo tanto: 1 2 2 E(uu ) = 1 2 . . .
1 . . .
2 1 . . .
T 1 T 2 T 3
T 1 T 2 T 3 . .. . . . 1
(3.2)
Es decir, bajo el modelo AR(1) con el parmetro || < 1, el nmero de parmetros contenidos en a u a 2 y . Esto es conveniente a la hora de tener que utilizar un mtodo de E(uu ) es solamente dos, e estimacin que requiera estimar esta matriz de varianzas y covarianzas. o Como se puede apreciar, la correlacin entre perturbaciones no es cero para ningn retardo, aunque o u a medida que estn ms alejadas entre s dado que || < 1, esta autocorrelacin va disminuyendo. a a , o Si 0 < < 1, todas las covarianzas, y por tanto las correlaciones, son positivas. Esto indica que el efecto de un shock positivo se mantiene en el tiempo con el mismo signo, aunque cada vez ser de a menor magnitud. Si este signo cambia por un nuevo shock t entonces tambin se mantendr en e a el tiempo el signo negativo. Por lo tanto, las realizaciones de un proceso AR(1) con coeciente positivo, mostrar una serie temporal con observaciones consecutivas agrupadas del mismo signo. a Cuanto ms cercano a uno sea el valor de ms tardar en general en cambiar el signo. a a a Si 1 < < 0, las covarianzas, y por tanto las correlaciones, alternan el signo siendo positivas entre perturbaciones separadas un nmero de retardos par y negativas entre aquellas separadas un u nmero de retardos impar. Esto indica que el efecto de un shock positivo tender a asociarse con u a un siguiente error de signo negativo y este con uno positivo, aunque cada vez de menor magnitud. Por lo tanto, las realizaciones de un proceso AR(1) con coeciente negativo mostrarn una serie a temporal con observaciones consecutivas que alternan el signo. Cuanto ms cercano a uno en valor a absoluto sea el valor de , ms se mantendr la alternancia del signo y su magnitud. a a Ejercicio 3.1 Escribe de forma general, sin restricciones sobre sus parmetros, la matriz de vaa rianzas y covarianzas del vector de perturbaciones E(uu ) para T = 10. Es una matriz simtrica? e Cuantas parmetros desconocidos tendr que estimar? Y si supones que la perturbacin sigue a as o un AR(1) con || < 1?
115
SARRIKO-ON 04/10
Anlisis de datos a
Los siguientes grcos ilustran la diferencia entre las realizaciones en el tiempo de un proceso que es a ruido blanco es decir, sin autocorrelacin (ut = t ), versus otras que siguen un AR(1) con coeciente o positivo (ut = 0, 95ut1 + t ) o negativo (ut = 0, 95ut1 + t ). Figura 3.1: Ruido blanco = 0
Ruido blanco (var=0.16)
Residuos
1.0 0
0.5
0.0
0.5
10
20
30 t
40
50
60
Figura 3.2: Proceso AR(1) con = 0, 95

AR(1) con coeficiente positivo 0.95
1.0 Residuos 1.5 0 1.0 0.5 0.0 0.5
10
20
30 t
40
50
60
116
Anlisis de datos a
SARRIKO-ON 04/10
Figura 3.3: Proceso AR(1) con = 0, 95

AR(1) con coeficiente negativo 0.95
1.5 Residuos 1.5 0 1.0 0.5 0.0 0.5 1.0
10
20
30 t
40
50
60
Proceso MA(1):
ut = t1 + t
2 t (0, )
iid
(3.3)
Las propiedades de este proceso son las siguientes: E(ut ) = E(t1 ) + E(t ) = 0
2 2 E(u2 ) = E(t1 + t )2 = 2 E(2 ) + E(2 ) + 2E(t t1 ) = (1 + 2 ) = u t t1 t
Es decir, las perturbaciones que siguen un MA(1) tienen media cero y varianza constante. Adems: a
2 E(ut ut1 ) = E(t1 + t )(t2 + t1 ) =
E(ut ut2 ) = E(t1 + t )(t3 + t2 ) = 0 E(ut uts ) = 0 2 E(uu ) = si s 2 1 + 2 0 . . . 0 1 + 2 . . . 0 y por lo tanto: 0 . . . 0 .. 0 0 0
1 + 2
(3.4)
. . . . 1 + 2
117
SARRIKO-ON 04/10
Anlisis de datos a
Ejercicio 3.2 Calcula la matriz de varianzas y covarianzas si consideramos escribir el proceso iid 2 MA(1) de la forma ut = t t1 donde t (0, ). Si llamamos = , obtienes lo mismo que antes?
2 Bajo el proceso MA(1) la matriz E(uu ) depende tambin de dos parmetros, y . A diferencia e a del proceso AR(1), las covarianzas entre perturbaciones solamente se mantienen distintas de cero entre aquellas separadas un periodo, siendo el resto igual a cero. Esto indica que si es mayor que cero, el efecto de un shock positivo en un periodo tiende a mantenerse en el tiempo con el mismo signo solamente por un periodo, siendo luego igual de factible que la realizacin sea positiva o o negativa dependiendo del shock de ese periodo. Si el valor de es negativo la alternancia ser de a positivo a negativo en el siguiente periodo o de negativo a positivo.
Los siguientes grcos ilustran las realizaciones en el tiempo de un proceso MA(1) positivo (ut = a 0, 95t1 + t ) y de un MA(1) negativo (ut = 0, 95t1 + t ).
Figura 3.4: Proceso MA(1) con = 0, 95

MA(1) con coeficiente positivo 0.95
Residuos
1.0 0
0.5
0.0
0.5
1.0
10
20
30 t
40
50
60
En los grcos podemos observar que las series generadas por procesos con autocorrelacin de a o orden uno positiva tienden a ser ms suaves que las series temporales generadas por procesos a con autocorrelacin de orden uno negativa. Los procesos autorregresivos tienden a acentuar esta o caracter stica relativamente a los de medias mviles. Procesos de mayor orden o combinaciones de o estos dos procesos son ms dif a ciles de detectar con un simple grco de la serie temporal. Otro a tipo de tcnicas de identicacin de estos procesos son los llamados grcos de autocorrelacin o e o a o correlogramas simple y parcial. 118
Anlisis de datos a
SARRIKO-ON 04/10
Figura 3.5: Proceso MA(1) con = 0, 95

MA(1) con coeficiente negativo 0.95
Residuos
1.0 0
0.5
0.0
0.5
1.0
10
20
30 t
40
50
60
3.2.
Contrastes de autocorrelacin y anlisis de residuos o a
Las perturbaciones no son observables, por lo que los residuos sern nuestra aproximacin a estas a o variables tanto en el anlisis grco como en los contrastes estad a a sticos. Al igual que en el tema de heterocedasticidad podemos utilizar como preliminar a un contraste estad stico de autocorrelacin, o el grco de la serie temporal de los residuos obtenidos de estimar por MCO la especicacin del a o modelo de inters. Vamos a estudiar dos contrastes diseados para contrastar la hiptesis nula de e n o ausencia de autocorrelacin frente a diversas alternativas de autocorrelacin en el error. o o
3.2.1.
Contraste de Durbin y Watson
Este contraste est diseado para contrastar la hiptesis nula de no autocorrelacin a n o o H0 : = 0,

2 ut = t (0, ) iid
frente a la alternativa de un proceso AR(1), donde la hiptesis alternativa puede ser o Ha : ut = ut1 + t o bien Ha : ut = ut1 + t El procedimiento es el siguiente: Se estima el modelo de inters por MCO y se calculan los residuos ut para t = 1, . . . , T . El estad e stico 119 1<<0 0<<1
SARRIKO-ON 04/10 de Durbin-Watson se calcula como: DW =

T 2 u t=2 (t ut1 ) T 2 t=1 ut
Anlisis de datos a
Se puede obtener una relacin aproximada entre este estad o stico y el coeciente de autocorrelacin o de orden uno en los residuos MCO denido como: =
T t=2 ut ut1 T 2 t=2 ut1
siendo esta relacin DW o 2(1 ), por lo tanto, se puede aproximar los valores que tomar el a estad stico para ese coeciente de autocorrelacin de orden uno en los residuos. o As el valor del estad , stico DW est entre (0, 4). Si el valor de DW est cercano a cero indica que a a el valor de est prximo a 1. Si (0, 1) entonces DW (2, 0), por lo que valores de DW de a o 2 hacia 0 indicaran evidencia hacia autocorrelacin de orden uno positiva. Si (1, 0) entonces o DW (4, 2), por lo que valores de DW de 2 hacia 4 indicaran evidencia hacia autocorrelacin de o orden uno negativa. Formalmente para realizar el contraste necesitamos conocer la distribucin del estad o stico bajo la hiptesis nula de no autocorrelacin, pero la distribucin de este estad o o o stico DW no es ninguna de las habituales y se demuestra que depende de la matriz X. Durbin y Watson han tabulado unas cotas, di (inferior) y ds (superior) de valores cr ticos, que permiten decidir si se rechaza la hiptesis o nula a un nivel de signicacin elegido. o Procedimiento: Dado el tamao muestral T y el nmero de regresores exceptuando el trmino n u e independiente K = K 1, obtenemos en la tabla de valores cr ticos tabulados las cotas inferior di y superior ds para un nivel de signicacin elegido. o Si DW (ds , 4 ds ), entonces no se rechaza H0 : = 0 frente a cualquiera de las dos alternativas bien Ha : 0 < < 1 o bien Ha : 1 < < 0. Por lo tanto, no hay evidencia de autocorrelacin de orden uno. o Si DW < di se rechaza H0 : = 0 y hay evidencia de autocorrelacin de orden uno positiva o Ha : 0 < < 1. Si DW > 4 di se rechaza H0 : = 0 versus la alternativa de autocorrelacin de orden uno o negativa Ha : 1 < < 0. Si DW (di , ds ) o si DW (4 ds , 4 di ), el estad stico cae en las zonas de indeterminacin o del contraste, por lo que el contraste no es concluyente. Comentarios: Este contraste puede detectar otros procesos AR o MA de mayor orden siempre y cuando den lugar a residuos con una autocorrelacin de orden uno signicativa. Por la misma razn o o puede detectar problemas de mala especicacin de la parte sistemtica del modelo. Pero el o a contraste no indica cul puede ser el caso. a 120
Anlisis de datos a
SARRIKO-ON 04/10
Si la autocorrelacin de orden uno no es signicativa puede que este contraste no detecte o procesos AR o MA de mayor orden. En las zonas de indeterminacin el contraste no es concluyente. No obstante, se deber tener o a en cuenta que tampoco se acepta la hiptesis nula de no autocorrelacin siendo cautos con o o los resultados MCO especialmente en la inferencia utilizando los estad sticos t y F habituales. Esta regin de indeterminacin es mayor cuanto menor nmero de grados de libertad se tengan o o u (menor T y mayor K). El estad stico de DW no es able en modelos que incluyen como variables explicativas la variable dependiente retardada Yt1 , Yt2 , . . . u otro tipo de regresor estocstico. a
3.2.2.
Contraste de Breusch y Godfrey
Este es un contraste ms general que el de Durbin-Watson. Se contrasta la hiptesis nula: a o

2 H0 : ut iid(0, )
frente a Ha : ut = 1 ut1 + . . . + p utp + t ut = 1 t1 + . . . + p tp + t AR(p) o MA(p)
2 donde t iid(0, ). Luego bajo H0 el proceso es un ruido blanco, no hay autocorrelacin. Bajo o la hiptesis alternativa el trmino de perturbacin puede seguir bien un proceso autorregresivo de o e o orden p o bien un proceso de medias mviles del mismo orden, elegido previamente a la realizacin o o del contraste. El procedimiento es el siguiente:
Se estima el modelo de inters por MCO: e Yt = 1 + 2 X2t + . . . + K XKt + ut Se calculan los residuos ut para t = 1, . . . , T . Se obtiene el coeciente de determinacin R2 de la siguiente regresin auxiliar: o o ut = 1 + 2 X2t + . . . + K XKt + 1 ut1 + . . . + p utp + t donde t = 1, . . . , T y p es el nmero de retardos elegido para el orden del proceso AR o MA bajo u la alternativa. Al realizar la regresin auxiliar usando todas las observaciones, incluidas las o primeras p (t = 1, . . . , p), se necesita el conocimiento de u0 , . . . , u1p . Una forma de solventar el problema de no conocer esos residuos es la de igualar u0 , . . . , u1p a cero. El estad stico del contraste y su distribucin asinttica bajo la hiptesis nula son: o o o BG = T R2 2 p
d,H0
bajo H0
donde T y R2 es el tamao muestral y el coeciente de determinacin, respectivamente, de la n o regresin auxiliar. o 121
SARRIKO-ON 04/10
Anlisis de datos a
Regla de decisin: Rechazar la hiptesis nula de no autocorrelacin a un nivel de signicao o o cin , si el valor muestral del estad o stico, denotado por BG, es tal que BG > 2 . p| Otra forma de realizar el contraste consiste en omitir las p observaciones iniciales de la regresin o auxiliar ut = 1 + 2 X2t + . . . + K XKt + 1 ut1 + . . . + p utp + t donde t = p + 1, . . . , T y considerar el R2 de esta regresin y el tamao muestral disponible o n (T p). En este caso el estad stico del contraste y su distribucin asinttica bajo la hiptesis o o o nula son: d,Ho (T p)R2 2 bajo H0 p siendo la regla de decisin igual que antes. o Comentarios: Este contraste es ms general que el de Durbin-Watson. Las alternativas pueden ser AR(p) a con p 1 y tambin M A(p). e A diferencia del contraste de Durbin-Watson, s se puede utilizar en modelos que incluyen como variables explicativas la variable dependiente retardada Yt1 , Yt2 , . . . u otro tipo de regresor estocstico. a Es un contraste asinttico esto es, bajo H0 se conoce la distribucin asinttica del estad o o o stico. Por lo tanto, es vlido para muestras grandes siendo cautos con los resultados para muestras a pequeas. n La eleccin del nmero de retardos p es importante. Un p pequeo puede no capturar autoo u n correlaciones signicativas de mayor orden, pero un p grande puede inuir negativamente en la potencia del contraste.
3.2.3.
Anlisis de los residuos y contrastes: ejemplos a
En esta seccin vamos a presentar varios ejemplos que ilustran la utilizacin de los grcos de o o a residuos para detectar la existencia de autocorrelacin y en algunos casos detectar una posible o mala especicacin del modelo. Tambin ilustramos la utilizacin del contraste de Durbin-Watson o e o no solamente para contrastar la existencia de autocorrelacin de orden uno, sino tambin como o e indicador de mala especicacin. o Ejemplo 3.1 Autocorrelacin positiva o
Se dispone del chero de datos inv.dat del libro Undergraduate Econometrics de Hill, Griths y Judge disponibles en http : //www.wiley.com/college/econ/hill331848/students.html. Son datos anuales desde 1974 a 2003 de las siguientes variables: I: Inversin real en billones de dlares. o o GNP: Producto Nacional Bruto real en billones de dlares. o 122
Anlisis de datos a R: Tipo de inters. e
SARRIKO-ON 04/10
Se estima por MCO un modelo que relaciona la Inversin real con el Producto Nacional Bruto real o y el tipo de inters incluyendo un trmino independiente. e e It = 1 + 2 GN Pt + 3 Rt + ut y los resultados de la estimacin son: o It = 6, 22494 + 0, 769911 GN Pt 0, 184196 Rt (2,51089) (0,0717905) (0,126416) (des(M CO )) R2 = 0, 816282 SCR = 299, 336 DW = 0, 852153 = 0, 567726 t = 1, . . . , 30
Figura 3.6: Grco de la serie de Inversin observada y estimada a o

I observada y estimada 35 estimada observada 30
25
20
15
10
5 1975 1980 1985 1990 1995 2000
La Figura 3.6 muestra el grco de las series de Inversin observada y estimada, que representa a o la evolucin en el periodo muestral considerado, de los valores observados de la variable Inversin o o It y de la Inversin estimada It que predice el modelo ajustado dados los valores observados de o las variables explicativas. El modelo estimado no recoge bien los ciclos de expansin y recesin o o observados en la Inversin, especialmente en los aos 1977-1982, y 1982-1988, siendo los observados o n mucho ms pronunciados que los generados por el modelo ajustado. Esto explica los ciclos observados a en el grco de la serie temporal de los residuos. Este hecho sugiere que el trmino de perturbacin a e o del modelo pueda recoger factores correlacionados en el tiempo tal que presente autocorrelacin o positiva al menos hasta de orden uno, pudiendo ser tambin de mayor orden. e La Figura 3.7 muestra la evolucin de los residuos ut = It It a lo largo del periodo muestral o considerado t = 1974, . . . , 2003. Como es de esperar, ya que hay trmino constante en la regresin, e o oscilan alrededor de su media muestral igual a cero. Se puede observar que especialmente de 1973 123
SARRIKO-ON 04/10
Anlisis de datos a
Figura 3.7: Grco de la serie temporal de los residuos MCO a

Residuos de la regresin (= I observada estimada) 6
0 residuo 2 4 6 8 1975 1980 1985 1990 1995 2000
a 1995 se van alternando en ciclos, grupos de residuos seguidos del mismo signo, siendo menos evidente al nal de la muestra, donde el ajuste es algo mejor. Contraste de Durbin-Watson: H0 : = 0 Ha : 0 < < 1
2 ut iid(0, u ) ut = ut1 + t
2 iid(0, )
No autocorrelacin. o AR(1) autocorrelacin positiva. o
Para = 0, 05, T = 30, K = 2 las cotas inferior y superior tabuladas respectivamente son di = 1, 2837 y ds = 1, 5666. Como DW = 0, 852153 < di = 1, 2837, se rechaza H0 . Hay evidencia de autocorrelacin de orden uno positiva en el trmino de perturbacin del modelo . o e o Ejemplo 3.2 Autocorrelacin negativa o
Se dispone de observaciones anuales de las variables Consumo (Ct ) y Renta (Rt ) para un pa s. Los resultados de la estimacin por el mtodo de M o e nimos Cuadrados Ordinarios de la funcin de o consumo Ct = 1 + 2 Rt + ut se muestran a continuacin: o Estimacin MCO, usando las observaciones 1950-1963 (T = 14) o Variable dependiente: C Coeciente const R R2 0,3470 0,7001 0,9467 0,7323 Desv. T pica 1,1371 0,0479 Estad stico t 0,3052 14,6101 Valor p 0,7654 0,0000 30,6381 3,3158
Suma de cuad. residuos DurbinWatson 124
Anlisis de datos a
SARRIKO-ON 04/10
Figura 3.8: Grco de la serie de Inversin observada y estimada a o

Consumo observada y estimada 30 estimada observada
25
Consumo
20
15
10
5 1950 1952 1954 1956 1958 1960 1962
Figura 3.9: Grco de la serie temporal de los residuos MCO a

Residuos de la regresin (= Y observada - ajustada) 3
residuo
-1
-2
-3 1950 1952 1954 1956 1958 1960 1962
La Figura 3.8 representa la evolucin en el periodo muestral considerado, de los valores observados o de la variable Consumo, Ct y del Consumo estimado, Ct que predice el modelo ajustado, dados los valores observados de las variables explicativas. El modelo ajustado parece predecir bien la tendencia creciente del consumo, incluso al nal de la muestra donde esta tendencia parece ser ms acusada. a Pero lo que el modelo no predice bien es la direccin del ciclo, ya que cuando se da una expansin o o el modelo predice una recesin y cuando se observa una recesin el modelo predice una expansin. o o o Esto hace que en la serie temporal de los residuos de la Figura 3.9 se observe una alternacia de 125
SARRIKO-ON 04/10
Anlisis de datos a
signos de positivo a negativo y viceversa a lo largo de todo el periodo. Esto sugiere que puede existir autocorrelacin de orden uno negativa. o Contraste de Durbin-Watson: H0 : = 0 Ha : 1 < < 0
2 ut iid(0, u ) ut = ut1 + t 2 t iid(0, )
No autocorrelacin. o AR(1) autocorrelacin negativa. o
Para = 0, 05, T = 14, K = 1 las cotas inferior y superior tabuladas son respectivamente, di = 1, 0450 y ds = 1, 3503. Como DW = 3, 315808 > 4 di = 2, 955 se rechaza H0 . Hay evidencia de autocorrelacin de orden uno negativa en el trmino de perturbacin del modelo. o e o Los siguientes ejemplos nos servirn para ilustrar que el contraste de Durbin-Watson puede detectar a autocorrelacin, pero ser una consecuencia de una mala especicacin funcional del modelo, o a o o cambios estructurales que no se han recogido. En estos casos hay que proceder a reespecicar el modelo. Ejemplo 3.3 Mala especicacin. Especicacin lineal versus cuadrtica o o a
Consideremos los siguientes datos anuales desde 1990 a 2001 observados para las variables Y y X: Y X 6 -4 3 -3 1 -2 1 -1 1 1 4 2 6 3 16 4 25 5 36 6 49 7 64 8
Se propone inicialmente la estimacin de una relacin lineal entre estas dos variables: o o Yt = 1 + 2 Xt + ut Estimacin MCO, usando las observaciones 1990-2001 (T = 12) o Variable dependiente: Y Coeciente const X 8,01220 4,45591 Desv. T pica 4,05896 0,919174 1501,071 0,853150 Estad stico t 1,9740 4,8477 R2 corregido DurbinWatson Valor p 0,0766 0,0007 0,671647 0,321828 (3.5)
Suma de cuad. residuos
El grco de la serie observada y ajustada, Figura 3.10, sugiere que el ajuste de una relacin lineal a o no parece ser la ms indicada, ya que la serie observada Y presenta una curvatura que no captura a el ajuste del modelo. Si analizamos el grco de residuos, Figura 3.11, vemos que la serie presenta a forma de U, lo que conrma que es mejor una relacin cuadrtica. La forma que presenta la serie o a de residuos hace que estos se concentren en grupos de residuos del mismo signo. Esto puede sugerir que el trmino de error del modelo presenta autocorrelacin de orden uno positiva. e o El valor del estad stico de Durbin-Watson es DW = 0, 321828. Las cotas inferior di y superior ds tabuladas para T = 12 y K = 1, al nivel de signicacin del 0, 05 son di = 0, 971 y ds = 1, 331. o Como el valor del estad stico DW es menor que la cota inferior di se rechaza la hiptesis nula o 126
Anlisis de datos a
SARRIKO-ON 04/10
Figura 3.10: Grco de la serie observada y ajustada con especicacin lineal a o

Y observada y estimada 70 60 50 40 30 20 10 0 -10 1990 1992 1994 1996 1998 2000 Y estimada observada
Figura 3.11: Grco de residuos MCO de la especicacin lineal a o

Residuos de la regresin (= Y observada estimada) 25 20 15 10 residuo 5 0 5 10 15 20 1990 1992 1994 1996 1998 2000
de no autocorrelacin frente a la alternativa de autocorrelacin positiva. El contraste parece estar o o capturando un problema de mala especicacin funcional. o Seguidamente se reespecica el modelo y se estima por MCO una relacin cuadrtica entre Yt y Xt o a 2 introduciendo como nuevo regresor Xt . Estimacion MCO de la especicacin cuadrtica. o a
2 Yt = 1 + 2 Xt + 3 Xt + vt 2 Los resultados, denotando XSQ = Xt , son los siguientes:
(3.6)
127
SARRIKO-ON 04/10 Estimacin MCO, usando las observaciones 19902001 (T = 12) o Variable dependiente: Y Coeciente const X XSQ 1,7816 1,0334 0,8825 Desv. T pica 0,7408 0,2064 0,0407 28,2431 0,2984 Estad stico t 2,4050 5,0058 21,6641 R2 corregido DurbinWatson Valor p 0,0396 0,0007 0,0000 0,9931 1,2157
Anlisis de datos a
Figura 3.12: Grco de la serie observada y ajustada con especicacin cuadrtica a o a

Y observada y estimada 70 60 50 40 30 20 10 0 -10 1990 1992 1994 1996 1998 2000 Y estimada observada
La Figura 3.12 de la relacin observada y ajustada muestra claramente que esta especicacin se o o ajusta mucho mejor a los datos. El grco de residuos, Figura 3.13, presenta una asociacin de a o residuos positivos y negativos mucho menor que antes. Tambin la magnitud de los residuos, en e valor absoluto, es mucho menor. Por otro lado, el valor del estad stico DW es mucho ms cercano a 2 y el valor ms cercano a cero, a a por lo que hay una menor evidencia de autocorrelacin en el trmino de perturbacin. Mirando a las o e o cotas inferior y superior tabuladas ahora para T = 12 y K = 2 son di = 0, 812 y ds = 1, 579. El valor muestral del estad stico se encuentra en la zona de indeterminacin, DW = 1, 216 (0, 812; 1, 579) o por lo que el contraste no es concluyente. Dado que el tamao muestral es pequeo, la zona de indeterminacin del contrastes es bastante n n o amplia y hay que hacer notar que el valor muestral de DW est ms cerca de la regin de aceptacin a a o o de la hiptesis nula (hacia cota superior) que de la de rechazo (hacia cota inferior). An as es o u , bastante evidente que el problema de autocorrelacin de orden uno positiva detectado anteriormente o 2 se deb a una mala especicacin funcional o de omisin de la variable Xt . De todas formas, pudiera a o o ser que quede an cierto grado de autocorrelacin en el trmino de error del modelo reespecicado, u o e aunque tampoco podemos concluir si este es el caso. En cuanto a los resultados de la estimacin o 128
Anlisis de datos a
SARRIKO-ON 04/10
Figura 3.13: Grco de residuos MCO de la especicacin cuadrtica a o a

Residuos de la regresin (= Y observada estimada) 3
residuo
4 1990 1992 1994 1996 1998 2000
2 del modelo (3.6), la variable Xt es signicativa al 5 %, ya que el valor p asociado a su coeciente es menor que 0, 05. Esto conrma que es ms adecuada una relacin cuadrtica que lineal. a o a
Ejemplo 3.4
Mala especicacin. Cambio estructural no recogido o
Consideramos los siguientes datos sobre salarios (W) y horas trabajadas (H) en un pa durante el s periodo 2001-2008. La variable cticia D recoge un cambio en la pol tica de empleo a partir del ao n 2005. Ao n W H D 2001 170 40 0 2002 180 50 0 2003 165 30 0 2004 165 40 0 2005 105 50 1 2006 95 35 1 2007 100 40 1 2008 90 35 1
En primer lugar, se estima el siguiente modelo para los salarios en funcin de las horas trabajadas, o donde no se tiene en cuenta el cambio en la pol tica de empleo. Wt = 1 + 2 Ht + ut Estimacin MCO, usando las observaciones 18 o Variable dependiente: W Coeciente const H 102,3210 0,7857 Desv. T pica 90,9652 2,2436 10571,43 0,122635 0,752888 129 Estad stico t 1,1248 0,3502 R2 corregido Valor p (de F ) DurbinWatson Valor p 0,3036 0,7382 0,143299 0,738160 0,445789 (3.7)
Suma de cuad. residuos F (1, 6)
SARRIKO-ON 04/10
Anlisis de datos a
Figura 3.14: Grco de la serie observada y ajustada con el Modelo (3.7) a

W (Salarios) observada y estimada 180 170 160 150 W (Salarios) 140 130 120 110 100 90 1 2 3 4 5 6 7 8 estimada observada
Figura 3.15: Grco de residuos MCO del Modelo (3.7) a

Residuos de la regresin (= W observada estimada) 40 30 20 10 residuo 0 10 20 30 40 1 2 3 4 5 6 7 8
A la vista del grco de la serie observada y ajustada, Figura 3.14, se sospecha que a partir del ao a n 2005 con el cambio en la pol tica de empleo, el nivel medio de los salarios baj de forma signicativa. o Este cambio estructural en los salarios no se ha recogido en la especicacin, por lo que la serie o ajustada de salarios se mantiene mucho ms estable que la serie observada. En cuanto al grco a a de residuos, Figura 3.15, se observa un primer grupo de valores positivos, correspondientes a los aos previos al cambio y posteriormente un segundo grupo de valores negativos. En consecuencia, n se detecta autocorrelacin de orden uno positiva, ya que el valor del estad o stico de Durbin-Watson es menor que la cota inferior di tabulada para el tamao muestral T = 8 y K = 1 esto es, n DW = 0, 445789 < di = 0, 7629. El valor del coeciente de autocorrelacin de orden uno en los o residuos = 0, 752888 tambin indica autocorrelacin positiva. e o 130
Anlisis de datos a
SARRIKO-ON 04/10
Tenemos que incluir en el modelo una variable cticia que recoja ese cambio en el nivel de los salarios m nimos a partir del ao 2005. Para ello, consideramos estimar el siguiente modelo ampliado donde n adems de las horas trabajadas incluimos como regresor la variable cticia D, para recoger ese a cambio estructural: Wt = 1 + 2 Ht + 3 Dt + ut (3.8) Estimacin MCO, usando las observaciones 18 o Variable dependiente: W Coeciente const H D 138,5710 0,7857 72,5000 Desv. T pica 7,5381 0,1835 2,4275 58,92857 0,265193 Estad stico t 18,3826 4,2817 29,8659 R2 corregido DurbinWatson Valor p 0,0000 0,0079 0,0000 0,992352 2,199134
Figura 3.16: Grco de la serie observada y ajustada con el Modelo (3.8) a

W (Salarios) observada y estimada 180 170 160 150 W (Salarios) 140 130 120 110 100 90 1 2 3 4 5 6 7 8 estimada observada
A la luz de los resultados de estimacin y de los grcos de la serie observada y ajustada y de o a residuos, Figuras 3.16 y 3.17 respectivamente, es claro que la variable cticia ha recogido el cambio estructural en el nivel medio de los salarios a partir de 2005. El coeciente que acompaa a la n variable cticia D es signicativamente distinto de cero. El ajuste ha mejorado sustancialmente, tanto en trminos del R2 corregido que ha aumentado considerablemente, como grcamente. El e a estad stico de Durbin-Watson toma un valor 2, 199 que pertenece a la zona de no rechazo de la hiptesis nula de no autocorrelacin (ds = 1, 7771; 4 ds = 2, 2229) dado el nivel de signicacin o o o 5 %, y T = 8, K = 2.Por lo tanto, se conrma que la evidencia de autocorrelacin en el modelo o (3.7) se deb a una mala especicacin. Una vez recogido el cambio estructural en la serie de a o salarios, incluyendo una variable cticia como variable explicativa adicional a las horas trabajadas, esta evidencia desaparece. 131
SARRIKO-ON 04/10
Anlisis de datos a
Figura 3.17: Grco de residuos MCO del Modelo (3.8) a

Residuos de la regresin (= W observada estimada) 3 2 1 0 residuo 1 2 3 4 5 1 2 3 4 5 6 7 8
Ejemplo 3.5
Aplicacin de los contrastes de autocorrelacin o o
Utilizamos los datos de la Tabla 6.3 del libro de Greene (1998) Anlisis Economtrico que estn en a e a el Apndice: Tablas de datos. Son datos de series temporales con frecuencia anual para la econom e a americana de los aos 1968 a 1982 de las siguientes series: n INVER: Inversin en trminos nominales o e PNB: Producto Nacional Bruto en trminos nominales e IPC: Indice de Precios al Consumo TI: Tipo de Inters, promedio anual de la tasa de descuento de la Reserva Federal de NY. e Con estos datos se construyen las series de Inversin y Producto Nacional Bruto en trminos reales o e dividiendo las series nominales por el IPC con ao base en 1972 y multiplicando por 101 con lo n cual las series estn medidas en trillones de dlares. La Tasa de Inacin se ha calculado como el a o o porcentaje de variacin del IPC y el Tipo de Inters es el promedio anual de la tasa de descuento del o e Banco de la Reserva Federal de Nueva York. El Tipo de Inters Real se obtiene como la diferencia e entre el Tipo de Inters Nominal y la Tasa de Inacin. e o IN V ERRt = (IN V ERt /IP Ct ) 0, 1 P N BRt = (P N Bt /IP Ct ) 0, 1 IN Ft = ((IP Ct IP Ct1 )/IP Ct1 ) 100 T IREALt = T It IN Ft 132
Anlisis de datos a
SARRIKO-ON 04/10
Partimos de una primera especicacin de la funcin de inversin incluyendo solamente el tipo de o o o inters real. Los resultados obtenidos son los siguientes: e Modelo sin PNBR como regresor:
INVERRt = 0,198273 + 0,006442 TIREALt (t-estad) (21,44) (1,42) T = 15 R2 = 0,068 F (1, 13) = 2,018 DW = 0,556216 = 0,669145 La variable Tipo de Inters Real, TIREAL, explica muy poco de la Inversin Real, INVERR. El e o coeciente de determinacin corregido es muy bajo, la variable TIREAL no es signicativa al 5 % o ya que el valor muestral del estad stico t, en valor absoluto, es menor que el valor cr tico 2, 16037. A la vista de los resultados del ajuste del modelo sin PNBR como regresor, la especicacin propuesta o no es muy adecuada. En la Figura 3.18 se muestra la evolucin en el tiempo de la Inversin Real y el Tipo de Inters o o e Real, en el periodo muestral considerado. La serie de Tipo de Inters Real es muy estable en los diez e primeros aos a excepcin del periodo 1973-1976 donde hay una bajada de tipos de inters seguida n o e de una recuperacin al mismo nivel anterior. Solamente hay una moderada tendencia creciente a o partir de 1978. La Inversin Real en cambio, presenta una tendencia creciente que se mantiene a lo largo de toda o la muestra. Alrededor de ella se muestran ciclos cada vez ms pronunciados de expansin y recesin a o o siendo la duracin del ciclo ms pronunciado de expansin aproximadamente tres aos y el de las o a o n recesiones sobre dos aos. n Figura 3.18: Evolucin temporal de las variables INVERR y TIREAL o
6 5 0.24 4 3 0.22 2 1 0 0.18 -1 -2 0.16 -3 -4 1968 1970 1972 1974 1976 1978 1980 1982 0.14 0.2 INVERR (derecha) TIREAL (izquierda) 0.26
En la Figura 3.19 el grco de la serie observada y ajustada por el modelo a la serie INVERR indica a 133
SARRIKO-ON 04/10
Anlisis de datos a
que el modelo no captura nada bien el comportamiento de la Inversin Real. La serie ajustada no o recoge la tendencia creciente en la serie ni tampoco los ciclos. El grco de la serie de residuos, Figura 3.20, es casi igual a la serie de la INVERR observada, y a dado que no se ha recogido ni siquiera la tendencia creciente, los residuos asociados a la primera mitad de la muestra son negativos y el resto son todos positivos. Esta agrupacin de residuos del o mismo signo seguidos hace pensar que se pueda detectar un problema de autocorrelacin de orden o uno positiva, pero el problema es claramente de una mala especicacin del modelo. o
Figura 3.19: Serie INVERR observada y ajustada: Modelo sin PNBR

INVERR observada y estimada 0.26 estimada observada 0.24
0.22
INVERR
0.2
0.18
0.16
0.14 1968 1970 1972 1974 1976 1978 1980 1982
Figura 3.20: Serie de residuos MCO: Modelo sin PNBR

Residuos de la regresin (= INVERR observada - estimada) 0.06
0.04
0.02
residuo
-0.02
-0.04
-0.06 1968 1970 1972 1974 1976 1978 1980 1982
134
Anlisis de datos a Contraste de Durbin-Watson: H0 : = 0 Ha : 0 < < 1

2 ut iid(0, u ) ut = ut1 + t
SARRIKO-ON 04/10
2 t iid(0, )
Para = 0, 05, el tamao muestral T = 15 y el nmero de regresores exceptuando el trmino n u e constante K = 1, las cotas tabuladas inferior y superior respectivamente son di = 1, 077 y ds = 1, 361. Como DW = 0, 556216 < di = 1, 077, se rechaza H0 al nivel de signicacin del 5 %. Hay o evidencia de autocorrelacin de orden uno positiva. o Contraste Breusch-Godfrey: a) Autocorrelacin hasta de orden uno. o H0 : = 0 o =0
2 ut iid(0, u ) 2 t iid(0, ) 2 t iid(0, )
No autocorrelacin. o AR(1) MA(1) o
Ha : = 0 ut = ut1 + t = 0 ut = t1 + t
Realizamos la regresin auxiliar correspondiente y calculamos el R2 para obtener el estad o stico. Consideramos t = 2, . . . , 15 esto es, 14 observaciones. ut = 0,004 0,003 TIREALt + 0,724 ut1 t-estad. (0,63) (0,99) (3,49) El coeciente de determinacin de la regresin auxiliar es R2 = 0,524809 por lo que el valor o o muestral del estad stico es BG = 14(0, 524809) = 7, 347326. Dado que el valor muestral del estad stico es mayor que el valor cr tico 2 1|0,05 = 3, 84, se rechaza H0 frente a Ha al 0, 05 de signicacin. Hay evidencia de autocorrelacin de orden uno. Veamos que ocurre si o o consideramos una alternativa ms general. a b) Autocorrelacin hasta de orden tres. o
2 H0 : 1 = 2 = 3 = 0 1 = 2 = 3 = 0 ut iid(0, u ) o
Ha : i = 0 para algn i u i = 0 para algn i u
ut = 1 ut1 + 2 ut2 + 3 ut3 + t ut = 1 t1 + 2 t2 + 3 t3 + t
2 o donde t iid(0, ). Realizamos la regresin auxiliar correspondiente y calculamos el R2 para obtener el estad stico. Consideramos t = 4, . . . , 15 esto es, 12 observaciones.
ut = 0,005 0,001 TIREALt + 0,838 ut1 0,308 ut2 0,069 ut3 t-estad. (0,58) (0,22) (2,05) (0,56) (0,15) El coeciente de determinacin de la regresin auxiliar es R2 = 0, 468251 por lo que el valor o o muestral del estad stico es BG = 12(0, 468251) = 5, 619012. Dado que el valor muestral del 135
SARRIKO-ON 04/10
Anlisis de datos a
estad stico es menor que el valor cr tico 2 3|0,05 = 7, 81, no se rechaza H0 frente a Ha al 0, 05 de signicacin. No hay evidencia de autocorrelacin hasta de orden tres. Vemos entonces que o o el incluir ms retardos hace que el contraste pierda potencia si estos no son necesarios. De a hecho en este caso no parece detectarse la autocorrelacin de orden uno que s era signicativa o cuando se considera solamente ese retardo. Los contrastes de autocorrelacin sugieren la existencia de autocorrelacin positiva de orden uno. o o Como hemos observado antes, esta evidencia de autocorrelacin de orden uno positiva se debe a un o pobre ajuste de este modelo. Esto puede estar capturando la omisin de alguna variable relevante o que deber de ser incluida para explicar mejor la inversin real. De hecho se debe de reespecicar a o el modelo incluyendo al menos una variable relevante para explicar la Inversin Real como es el o Producto Nacional Bruto en trminos reales PNBR. e Modelo con PNBR como regresor: INVERRt = 0,048683 0,002126 TIREALt + 0,197170 PNBRt t-estad. (1,08) (0,72) (5,51) T = 15 R2 = 0,714 F (2, 12) = 18,496 DW = 1,374911
El ajuste ha mejorado sustancialmente en trminos del coeciente de determinacin corregido. El e o valor del estad stico F (2, 12) = 18, 496 para el contraste de signicacin conjunta es mayor que el o valor cr tico al 0, 05 de signicacin (3, 89). Luego conjuntamente las variables explicativas TIREAL o y PNBR parecen ser relevantes para explicar la Inversin Real, aunque a nivel de signicatividad o individual, los estad sticos t muestran que solamente es signicativa la variable PNBR, no siendo TIREAL individualmente signicativa (el valor cr tico al 5 % en las tablas de la t-Student con 12 grados de libertad es 2, 179). Por lo tanto, esta especicacin del modelo donde adems del Tipo de o a Inters Real se ha incluido el Producto Nacional Bruto en trminos reales, parece ms adecuada. e e a La Figura 3.21 muestra el grco de la serie INVERR observada y la ajustada por el modelo, a indica que esta ultima especicacin captura mejor el comportamiento de la Inversin Real. La o o serie ajustada recoge la tendencia creciente en la serie, pero no se ajusta del todo bien a los ciclos. El grco de la serie de residuos, Figura 3.22, ya no presenta esa asociacin de residuos del mismo a o signo seguidos, pero muestra los ciclos de expansin y recesin que se daban en la serie de Inversin o o o Real, siendo el ciclo ms pronunciado de expansin sobre tres aos y las recesiones sobre dos aos. a o n n Esto sugiere que pueda no ser signicativa la autocorrelacin de primer orden positiva, pero que o pueda existir evidencia de autocorrelacin signicativa de orden dos o tres. o Contraste de Durbin-Watson: H0 : = 0 Ha : 0 < < 1
2 ut iid(0, u ) ut = ut1 + t 2 t iid(0, )
Para = 0,05, T = 15, K = 2 las cotas tabuladas son di = 0, 946 y ds = 1, 543. 136
Anlisis de datos a
SARRIKO-ON 04/10
Como el valor muestral del estad stico est entre los valores inferior y superior, di = 0, 946 < a DW = 1, 347911 < ds = 1, 543, que es la zona de indeterminacin del contraste, el contraste no es o concluyente. El valor del estad stico esta ms cerca de la cota superior o lo que es lo mismo, ms a a cerca de la zona de aceptacin de la hiptesis nula. o o Figura 3.21: Serie INVERR observada y ajustada: Modelo con PNBR
INVERR observada y estimada 0.26 estimada observada 0.24
0.22
INVERR
0.2
0.18
0.16
0.14 1968 1970 1972 1974 1976 1978 1980 1982
Figura 3.22: Serie de residuos MCO: Modelo con PNBR

Residuos de la regresin (= INVERR observada - estimada) 0.03
0.02
0.01
0 residuo -0.01 -0.02 -0.03 -0.04 1968 1970 1972 1974 1976 1978 1980 1982
137
SARRIKO-ON 04/10 Contraste Breusch-Godfrey: a) Autocorrelacin hasta de orden uno: o H0 : = 0 o =0

2 ut iid(0, u ) 2 t iid(0, ) 2 t iid(0, )
Anlisis de datos a
Ha : = 0 ut = ut1 + t = 0 ut = t1 + t
Realizamos la regresin auxiliar correspondiente a este modelo y esta alternativa. Calculamos o 2 para obtener el estad el R stico. Consideramos t = 2, . . . , 15 esto es, 14 observaciones. ut = 0, 001 + 0, 0007 PNBR 0, 0001 TIREAL + 0, 2712 ut1
(0,029) (0,016) (0,034) (0,785)
El coeciente de determinacin de la regresin auxiliar es R2 = 0, 058756 por lo que el valor o o muestral del estad stico es BG = 14 (0, 058756) = 0, 822584. Dado que el valor muestral del estad stico es menor que el valor cr tico 2 1|0,05 = 3, 84, no se rechaza H0 frente a Ha al 5 % de signicacin. No hay evidencia de autocorrelacin hasta de orden uno. o o Los contrastes de autocorrelacin sugieren que no hay problemas de autocorrelacin, aunque o o el de Durbin-Watson no es concluyente. La cuestin es que en estos contrastes las alternativa a o contrastar es un proceso con autocorrelacin de orden uno. Pudiera ser que la autocorrelacin o o de primer orden no sea muy signicativa, pero debido a los ciclos de dos y tres aos exista n autocorrelacin de orden tres. Por ello, hacemos el contraste de Breusch-Godfrey para una o alternativa de mayor orden, por ejemplo de orden 3: b) Autocorrelacin hasta de orden 3: o H0 : 1 = 2 = 3 = 0 1 = 2 = 3 = 0 o Ha : i = 0 para algn i u i = 0 para algn i u
2 ut iid(0, u )
No autocorrelacin. o AR(3) o MA(3)
ut = 1 ut1 + 2 ut2 + 3 ut3 + t ut = 1 t1 + 2 t2 + 3 t3 + t
2 donde t iid(0, ). Realizamos la regresin auxiliar correspondiente y calculamos el R2 o para obtener el estad stico. Consideramos t = 4, . . . , 15 esto es, 12 observaciones.
ut = 0, 0674 0, 051 PNBR + 0, 005 TIREAL 0, 198 ut1

(0,929) (0,918) (1,321) (0,490)
0, 011 ut2 1, 106 ut3

(0,032) (2,364)
El coeciente de determinacin de la regresin auxiliar es R2 = 0, 599334 por lo que el valor o o muestral del estad stico es BG = 12 (0, 599334) = 7, 192. Dado que el valor muestral del estad stico es menor que el valor cr tico 2 3|0,05 = 7, 81, no se rechaza H0 frente a Ha al 5 % de signicacin. No hay evidencia de autocorrelacin hasta de orden tres. o o Qu ocurre si consideramos en el contraste todas las observaciones? gretl realiza de esa forma e el contraste de Breusch-Godfrey, donde se igualan a cero el valor de los residuos no disponibles 138
Anlisis de datos a
SARRIKO-ON 04/10
u0 , u1 , u2 . En la ventana de estimacin por MCO del modelo de inters, eligiendo Contrastes o e Autocorrelacin se obtiene: o ut = 0, 021 0, 016 PNBR + 0, 003 TIREAL 0, 209 ut1
(0,602) (0,579) (1,251) (0,591)
0, 031 ut2 1, 0103 ut3

(0,099) (2,587)
El coeciente de determinacin de esta regresin auxiliar es R2 = 0, 551856 por lo que el valor o o muestral del estad stico es BG = 15 (0, 551856) = 8, 277847. Dado que el valor muestral del estad stico es mayor que el valor cr tico 2 3|0,05 = 7, 81, en este caso se rechaza H0 frente a Ha al 5 % de signicacin. Habr cierta evidencia de autocorrelacin de orden tres, aunque no o a o de orden uno. Por lo tanto, el problema detectado de autocorrelacin de orden uno en el modelo donde no se incluye o el PNBR parece haberse resuelto incluyendo esa variable que resulta ser relevante en media para explicar la Inversin real. Todav se puede considerar cierta evidencia marginal de autocorrelacin o a o de orden tres, quiz debido a un componente c a clico residual no explicado por el modelo en la serie de Inversin Real. De todas formas, el nmero de observaciones es algo limitado y el contraste o u parece verse afectado por este hecho.
3.3.
Consecuencias de la deteccin de autocorrelacin o o
En los ejemplos anteriores hemos visto que a veces se detecta autocorrelacin debida a una mala o especicacin del modelo. En ese caso, el problema es de omisin de variables relevantes ms que o o a de pura autocorrelacin. Si las variables omitidas estn correlacionadas con las incluidas, entonces o a habr sesgos en la estimacin de los coecientes de inters por MCO. As mismo la inferencia no a o e ser vlida. En ese caso hay que intentar volver a especicar el modelo incluyendo aquellos factores a a que son relevantes y que hemos omitido en primera instancia. Por otro lado, si el problema es puramente de autocorrelacin es decir, existen factores no relevantes o en media que se recogen en el trmino de perturbacin y presentan correlacin entre s a lo largo e o o del tiempo, las consecuencias son otras: Al ser factores no relevantes en media esto es, E(u) = 0, si los regresores son no estocsticos, a el estimador MCO de los coecientes ser lineal e insesgado. a La matriz de varianzas y covarianzas del vector de perturbaciones no esfricas, siga el trmino e e de perturbacin un proceso AR(p) o MA(q) o una combinacin de los dos, es tal que E(uu ) = o o 2 I. Esto implica que el estimador MCO ya no es el de menor varianza dentro de la clase de estimadores lineales e insesgados. Por lo tanto, no es el estimador eciente. En muestras grandes, en general el estimador MCO es consistente, pero seguir siendo no a eciente asintticamente. o El estimador usual utilizado para estimar V (M CO ) = (X X)1 X X(X X)1 dado por la 2 (X X)1 es un estimador sesgado e inconsistente si E(uu ) = 2 I. expresin V (M CO ) = o 139
SARRIKO-ON 04/10
Anlisis de datos a
Por lo tanto, la inferencia utilizando este estimador de V (M CO ) no es vlida ni siquiera en a muestras grandes. El estimador de lineal, insesgado y eciente en este caso es el obtenido por el mtodo de MCG. e Como ya vimos en un tema anterior, el mtodo de estimacin de M e o nimos Cuadrados Generalizados incorpora en el criterio de estimacin la informacin adicional en la matriz de varianzas y covarianzas o o de las perturbaciones, E(uu ) = 2 . La funcin objetivo a minimizar viene dada por o M in u 1 u = M in (Y X ) 1 (Y X ) (3.9)
donde es conocida y 2 es un factor de escala al que es invariante el estimador. Para el caso particular de que el trmino de perturbacin siga un AR(1), si el valor de es conocido, la funcin e o o criterio a minimizar con respecto a es la siguiente suma de cuadrados: SCR() = (1 2 ) (Y1 1 2 X21 . . . K XK1 )2
T
+
t=2
(Yt Yt1 ) 1 (1 )
2 (3.10)
j (Xjt Xj,t1 )
j=2
Minimizar esta funcin es equivalente a estimar por MCO el siguiente modelo transformado en el o que se verican las hiptesis bsicas. Para la primera observacin, o a o 1 2 Y1 = 1 1 2 + 2 1 2 X21 + . . . + K 1 2 XK1 + 1 (3.11)
y para el resto de observaciones t = 2, . . . , T es, Yt Yt1 = 1 (1 ) + 2 (X2t X2t1 ) + . . . + K (XKt XKt1 ) + t (3.12)
2 donde t IID(0, ). Por tanto, la primera observacin sufre una transformacin diferente a todas o o las dems. a
Normalmente el valor de los parmetros de los que depende no son conocidos. Por lo general se a podr disponer de un estimador previo de estos parmetros para obtener el estimador MCGF de . a a Veamos como obtener este estimador en el caso de que sea un AR(1) el proceso que sigue el trmino e de error del modelo de inters. e
3.4.
Estimacin por MCGF bajo un AR(1) o
Suponemos que el modelo de inters es e Yt = Xt + ut ut = ut1 + t

2 t iid(0, )
a siendo Xt = [1 X2t . . . XKt ] y no se conoce el valor poblacional del parmetro . El modelo transformado tal que el error es un ruido blanco se puede escribir como: Yt Yt1 = (Xt Xt1 ) + t 140 t = 2, ..., T
Anlisis de datos a donde Xt = [1 X2t . . . XKt ].
SARRIKO-ON 04/10
En general no se considera la primera observacin del modelo transformado, porque el estimador o as obtenido es asintticamente equivalente a considerar todas las observaciones y computacional o mente es ms sencillo de obtener. a
3.4.1.
Mtodo de Hildreth y Lu: Red de bsqueda e u
Dado que (1, 1), se realiza una particin de este intervalo y se estima por MCO el modelo o transformado para los diferentes valores del parmetro en esa particin. Se elige aqul valor de a o e y las estimaciones de por MCO en el modelo transformado correspondientes, que proporcionan una menor suma de cuadrados residual en la estimacin. o Los pasos de este mtodo de estimacin son: e o Se particiona el intervalo (1, 1) en una serie de valores equidistantes, i , i = 1, . . . , S, por ejemplo, 0,95, 0,9, 0,85, . . . , 0,05, 0, 0,05, . . . , 0,95. Esta ser la red de bsqueda sobre a u el parmetro a la hora de minimizar la suma de cuadrados residual al estimar por MCO a en el modelo transformado. Para cada i en la red, se estima por MCO en el modelo transformado Yt i Yt1 = (Xt i Xt1 ) + wt y se obtiene su suma de cuadrados residual
T T
t = 2, . . . , T
SCRi =
t=2
(wi t ) =
t=2
(Yt i Yt1 ) (Xt i Xt1 )i
donde wit t = 2, . . . , T son los residuos de estimar por MCO en el modelo transformado con ese valor i . Los estimadores HL y HL sern los asociados a la menor suma de cuadrados residual SCRi a del modelo transformado para los valores i i = 1, . . . , S en la red. Para mayor precisin, se o puede repetir el proceso anando la red de bsqueda en torno al valor HL que ha proporciou nado la SCRi m nima.
Ejemplo 3.6
Ejemplo de estimacin por Hildreth-Lu. o
Seguimos con el Ejemplo 4.1 sobre el modelo que relaciona la Inversin Real con el Producto Nacional o Bruto Real y el Tipo de Inters incluyendo un trmino independiente: e e It = 1 + 2 GN Pt + 3 Rt + ut t = 1, . . . , 30
Consideramos estimar por el mtodo de Hildreth-Lu bajo el supuesto de que ut sigue un proceso e AR(1). El criterio de estimacin del mtodo de Hildreth-Lu es elegir el valor de en la red tal que o e la suma de cuadrados residual de estimar el modelo transformado (It It1 ) = 1 (1 ) + 2 (GN Pt GN Pt1 ) + 3 (Rt Rt1 ) + wt 141
SARRIKO-ON 04/10 por MCO es la menor. M in SCR() = M in donde Yt = It It1 ;

X1t = 1 ; X2t = GN Pt GN Pt1 ; t=30 t=2
Anlisis de datos a
Yt 1 X1t 2 X2t 3 X3t
X3t = Rt Rt1
En la Figura 3.23 se muestra la Suma de Cuadrados Residual del modelo transformado para cada valor del parmetro en la red de bsqueda. a u Figura 3.23: Funcin de Suma de Cuadrados Residual del modelo transformado o
900 800 700 600 SCR 500 400 300 200 100 -1 -0.5 0 rho 0.5 1
El menor valor de la suma de cuadrados residual del modelo transformado es igual a 185, 96 y se alcanza para el valor = 0, 61. Ese valor es la estimacin elegida para . Dado ese valor obtenemos o las estimaciones de los parmetros de inters de aplicar MCO al modelo transformado: a e (It 0, 61 It1 ) = 1 (1 0, 61) + 2 (GN Pt 0, 61 GN Pt1 ) + 3 (Rt 0, 61 Rt1 ) + wt HL = 1
2 X1t X1t X2t X1t X3t
X1t X2t 2 X2t X2t X3t
X1t X3t
X2t X3t 2 X3t =0,61
Yt X2t X Yt 3t =0,61
Yt X1t
Mtodo de HildrethLu, usando las observaciones 19752003 (T = 29) e Variable dependiente: I = 0,614637 142
Anlisis de datos a Coeciente const GNP R 7,3298 0,7848 0,2957 Desv. T pica 3,6585 0,1442 0,0786 Estad stico t 2,0035 5,4418 3,7596
SARRIKO-ON 04/10 Valor p 0,0556 0,0000 0,0009
Estad sticos basados en los datos rho-diferenciados: Suma de cuad. residuos 185,9631
La funcin de regresin muestral obtenida por tanto es la siguiente: o o It = 7, 3195 + 0, 7851 GN Pt 0, 2955 Rt HL )) (3,6229) (0,1428) (0,0788) (des(
3.4.2.
Mtodo de Cochrane-Orcutt e
Este procedimiento, al igual que el de Hildreth-Lu, consiste en minimizar la suma de cuadrados residual del modelo transformado, pero diere en la forma de estimar el parmetro . Los pasos a a seguir son los siguientes: 1. Se estima el modelo original o de inters Yt = Xt + ut por MCO y se calculan los residuos e ut . 2. Se obtiene de la regresin MCO en: o ut = t1 + vt u t = 2, . . . , T
El estimador as obtenido es el coeciente de autocorrelacin de orden uno en los residuos: o =

T t=2 ut ut1 T 2 t=2 ut1
Parece razonable utilizar este estimador como aproximacin muestral al coeciente de autoo correlacin de orden uno poblacional entre las perturbaciones . Ahora bien, siempre y cuando o los residuos sean funcin de un estimador de en el modelo de inters que sea consistente. o e 3. Estimar por MCO en el modelo transformado: Yt Yt1 = (Xt Xt1 ) + wt t = 2, . . . , T
Podemos iterar el proceso entre estas dos etapas utilizando en la primera etapa los residuos obtenidos de sustituir en el modelo de inters las estimaciones de los parmetros , obtenidos en la e a segunda etapa. El proceso iterativo nalizar cuando se alcance un criterio de convergencia previaa mente establecido. Por ejemplo, en trminos de la diferencia en valor absoluto de l as estimaciones e del parmetro , o de la suma de cuadrados residual de la segunda etapa entre dos iteraciones a consecutivas.
143
SARRIKO-ON 04/10 Ejemplo 3.7 Ejemplo de estimacin por Cochrane-Orcutt. o
Anlisis de datos a
Seguimos con el ejemplo anterior sobre el modelo que relaciona la Inversin Real con el Producto o Nacional Bruto real y el tipo de inters incluyendo un trmino independiente. Estimamos por MCO e e el modelo de inters e It = 1 + 2 GN Pt + 3 Rt + ut t = 1, . . . , 30 y guardamos los residuos. u1974 2,036858 u1982 -4,457423 u1990 0,052044 u1998 3,423955 u1975 1,003142 u1983 -4,220092 u1991 2,172243 u1999 -3,045531 u1976 -0,121917 u1984 -6,105541 u1992 3,365111 u2000 1,094203 u1977 -0,823617 u1985 -6,300801 u1993 2,684884 u2001 2,702973 u1978 4,430448 u1986 -3,061876 u1994 0,883149 u2002 -0,142711 u1979 4,556650 u1987 -3,820975 u1995 -3,807123 u2003 1,799846 u1980 4,864468 u1988 1,406905 u1996 -3,346817 u1981 2,402315 u1989 0,682641 u1997 -0,307411
Con estos residuos calculamos el valor de de la regresin o ut = t1 + vt u t = 2, . . . , 30
MCO, usando las observaciones 1975-2003 (T = 29) Variable dependiente: uhat Coeciente uhat 1 0,567726 Desv. T pica 0,155221 Estad stico t 3,6575 Valor p 0,0010
El estimador as obtenido es el coeciente de autocorrelacin de orden uno en los residuos: o =

2003 t=1975 ut ut1 2003 2 t=1975 ut1
El valor muestral inicial para es 0, 567726. Con esta primera estimacin de se obtiene el modelo o transformado: (It 0, 56773 It1 ) = 1 (1 0, 56773) + 2 (GN Pt 0, 56773 GN Pt1 ) + 3 (Rt 0, 56773 Rt1 ) + wt y se estiman por MCO los coecientes . De nuevo se calculan los residuos en el modelo de inters e utilizando las estimaciones de en esta etapa y se calcula un nuevo valor de en una segunda iteracin = 0, 61380. Con esta nueva estimacin de se vuelve a obtener por MCO en el modelo o o transformado. Se vuelven a calcular los residuos en el modelo de inters y as sucesivamente se e realiza el clculo iterativo. El proceso se para en la iteracin en la que se alcanza el criterio de a o convergencia en trminos de la variacin de la suma de cuadrados residual del modelo transformado e o entre dos iteraciones consecutivas: 144
Anlisis de datos a Realizando el clculo iterativo de rho... a ITERACION RHO SCR 1 0,56773 186,623 2 0,61380 185,963 nal 0,61462 185,963
SARRIKO-ON 04/10
donde SCR es la suma de cuadrados residual de la estimacin MCO de en el modelo transformado o para cada estimacin de en cada iteracin. Se alcanza el criterio de convergencia en la tercera o o iteracin y las estimaciones nales del proceso iterativo son: o Mtodo de CochraneOrcutt , usando las observaciones 19752003 (T = 29) e Variable dependiente: I = 0,614623 Coeciente const GNP R 7,3298 0,7848 0,2957 Desv. T pica 3,6584 0,1442 0,0786 Estad stico t 2,0036 5,4420 3,7596 Valor p 0,0556 0,0000 0,0009
Estad sticos basados en los datos rho-diferenciados: Suma de cuad. residuos 185,9631
La funcin de regresin muestral obtenida por el mtodo de Cochrane-Orcutt diere muy poco de o o e la obtenida por el mtodo de Hildreth-Lu, como era de esperar, y es la siguiente: e It = 7, 3298 + 0, 7848 GN Pt 0, 2957 Rt CO )) (3,6584) (0,1442) (0,0786) (des(
3.5.
Inferencia utilizando el estimador MCO con autocorrelacin o

Y = X + u u N (0, )
En el modelo: donde = 2 I. Queremos contrastar q restricciones lineales sobre los K parmetros de inters a e del tipo H0 : R = r. En esta situacin, el estimador MCO de los coecientes del modelo, M CO = (X X)1 X Y es lineal, o insesgado y consistente, pero no es eciente. Su matriz de varianzas y covarianzas viene dada por la expresin: o V (M CO ) = (X X)1 X X(X X)1 El estimador de V (M CO ) dado por V (M CO ) = 2 (X X)1 donde 2 =
uu T k ,
es un estimador sesgado e inconsistente si = 2 I. 145
SARRIKO-ON 04/10
Anlisis de datos a
Dado que M CO es consistente, si proponemos un estimador alternativo para V (M CO ) que sea consistente podremos denir estad sticos de contraste vlidos al menos asintticamente. a o Estimador de Newey-West de V (M CO ): El estimador consistente de la matriz de varianzas y covarianzas del estimador MCO, robusto a autocorrelacin es: o V (M CO )N W = (X X)1 Q(X X)1
T siendo Q = 2 j=1 ut Xt Xt + Xt = [1 X2t . . . XKt ] L =1 T t= +1 w
ut ut [Xt Xt + Xt Xt ] donde w = 1
L+1
Para realizar inferencia vlida al menos asintticamente, podemos utilizar los estad a o sticos basados en el estimador de por MCO y un estimador consistente de su matriz de varianzas y covarianzas, por ejemplo el anterior V (M CO )N W : Para q = 1, el estad stico de contraste y su distribucin asinttica bajo H0 son: o o (RM CO r) RV (M CO )N W R
d,H0
N (0, 1)
Para q 1, el estad stico de contraste y su distribucin asinttica bajo H0 son: o o

d,H0 (RM CO r) [RV (M CO )N W R ]1 (RM CO r) 2 q
El utilizar este estimador de V (M CO ) por Newey-West permite seguir utilizando el estimador de los coecientes MCO para hacer inferencia vlida asintticamente, sin tener que modelizar ni estimar a o directamente E(uu ) = . Esto permitir que la inferencia sea vlida utilizando los estad a a sticos anteriores, al menos para muestras grandes. La cuestin es que esto no implica una mejora en la o precisin con la que estimamos por MCO. Para eso tenemos que estimar por M CG y esto implica o conocer excepto por un factor de escala, o bien por M CGF lo que requiere modelizar el proceso de autocorrelacin y estimar los parmetros de los que es funcin . o a o e Ejemplo 3.8 Contraste de signicatividad individual de la variable tipo de inters. Utilizamos para realizar el contraste los resultados de estimar los coecientes por MCO junto a las estimaciones de las desviaciones t picas robustas a la posible existencia de autocorrelacin. o It = 6, 22494 + 0, 769911 GN Pt 0, 184196 Rt ( 2,04053 ) (0,0722822) (0,114826) (des(M CO )N W ) Contrastamos la signicatividad del tipo de inters. Utilizando estos resultados podemos realizar el e contraste: H0 : 3 = 0 Ha : 3 = 0 146
Anlisis de datos a con el estad stico t=
SARRIKO-ON 04/10
3,M CO d,H0 N (0, 1) 3,M CO )N W des(
Obtenemos el valor muestral del estad stico, que en valor absoluto no supera el valor cr tico, | t |= 1, 6041 < 1, 96 = N (0, 1)|0,025 , por lo que no rechazamos H0 para un nivel de signicacin = 5 % o por lo que no habr evidencia para concluir que el tipo de inters es una variable signicativa. a e
3.6.
Inferencia con MCGF
Si consideramos modelizar el proceso de autocorrelacin en las perturbaciones, estimar con un o estimador consistente y utilizar el estimador de por M CGF , que ser consistente y asintticaa o mente eciente, podemos hacer inferencia utilizando los siguientes estad sticos: Para q 1: (RM CGF r) [RV (M CGF )R ]1 (RM CGF r) 2 q Para q = 1: (RM CGF r) RV (M CGF )R
d,H0
d,H0
N (0, 1)
siendo V (M CGF ) un estimador consistente de V (M CGF ). Esto es, V (M CGF ) = (X 1 X)1 Si = 2 entonces un estimador consistente de es = 2 donde es un estimador consistente M CGF y de utilizado para obtener u u 2 = T K donde u u = (Y X M CGF ) 1 (Y X M CGF ) = (Y X M CGF ) (Y X M CGF )
Ejemplo 3.9 Contrastamos la signicatividad del tipo de inters utilizando los resultados antee riores de la estimacin por Hildreth-Lu: o It = 7, 31954 + 0, 785198 GN Pt 0, 295541 Rt (3,62292) (0,142836) (0,0788497) (des(HL )) H0 : 3 = 0 Ha : 3 = 0 con el estad stico t= 3,HL d,H0 N (0, 1) 3,HL ) des(
Como | t |= 3, 7482 > 1, 96 = N (0, 1)|0,025 es decir, el valor muestral del estad stico en valor absoluto supera el valor cr tico, rechazamos H0 y concluimos que el tipo de inters es una variable e signicativa, al 5 % de signicacin. o 147
SARRIKO-ON 04/10
Anlisis de datos a
Cul es la diferencia entre el contraste de signicatividad realizado utilizando el estimador de a Hildreth-Lu y el que utiliza el estimador MCO del coeciente que acompaa al tipo de inters n e utilizando un estimador robusto a autocorrelacin de su desviacin t o o pica? La diferencia entre ambos contrastes est en el estimador utilizado para construir el estad a stico. El estimador de Hildreth-Lu es un estimador de MCGF y es asintticamente ms eciente que o a el estimador MCO. El resultado del contraste es distinto, ya que en el primer caso no se rechaza la hiptesis nula por lo que la variable tipo de inters es una variable signicativa, mientras que o e en el segundo se rechaza la hiptesis nula, pudiendo ser consecuencia de utilizar en el contraste o un estimador ms eciente asintticamente. Por esa razn, aunque ambos contrastes son vlidos a o o a asintticamente, puede ser mejor utilizar el contraste basado en MCGF. Pero para ello es necesario o estimar consistentemente , lo que no siempre es sencillo.
3.7.
A continuacin se proponen varios ejercicios para que el alumno vaya haciendo a la vez que se va o explicando la materia en las clases magistrales, y cuyas dudas se resolvern a lo largo de estas: a Ejercicio M-A.1 Sea el siguiente modelo: Yt = 1 + 2 X2t + 3 X3t + 4 X4t + ut Los resultados de la estimacin MCO son: o Yt = 1, 51 0, 14 X2t + 0, 998 X3t 0, 52 X4t M CO )) (0,12) (0,01) (0,015) (0,02) (des( R2 = 0, 97 DW = 0, 74 t = 1, 2, . . . , 52
Completa las matrices en base a la informacin disponible. Razona y explica tu respuesta. o
E(u) =
E(uu ) =
Ejercicio M-A.2 Se dispone de observaciones anuales de las variables Consumo (Ct ) y Renta (Rt ) para un pa Los s. datos se muestran en las primeras columnas de la siguiente tabla: 148
Anlisis de datos a
SARRIKO-ON 04/10
Obs. 1 2 3 4 5 6 7 8 9 10 11 12 13 14
C 8,547 8,942 10,497 10,173 11,997 10,729 12,750 15,611 13,545 17,843 21,610 25,473 24,434 28,274
R 11,0 13,5 14,0 14,9 15,1 18,0 18,8 19,1 21,0 21,2 34,0 34,3 35,0 38,0
C 8,0483680 9,7986580 10,148716 10,778820 10,918843 12,949180 13,509273 13,719307 15,049528 15,189551 24,151036 24,361070 24,851152 26,951500
u 0,498632 -0,856658 0,348284 -0,605820 1,078157 -2,220180 -0,759273 1,891693 -1,504528
Los resultados de la estimacin por el mtodo de M o e nimos Cuadrados Ordinarios (MCO) de la funcin de consumo o Ct = 1 + 2 Rt + ut se muestran a continuacin: o = 0, 347092 + 0, 700116 Rt Ct (t estad.) (0,31) (14,61) R2 = 0, 942 SCR = 30, 6381 (3.13)
1. La ultima columna de la tabla anterior muestra los residuos de la estimacin anterior, com o pltala y dibuja la serie temporal de los residuos. A la vista del grco comenta razonadamente e a si existe algn problema. u 2. Obtn el valor del estad e stico de Durbin y Watson y realiza el contraste para el cul est dia a seado. Indica todos los elementos del contraste incluyendo la hiptesis nula y la alternativa. n o 3. Utilizando la siguiente informacin realiza el contraste de Breusch y Godfrey. Indica todos los o elementos del contraste incluyendo la hiptesis nula y la alternativa. o
= 0, 5679 + 0, 0198 Rt 0, 75 ut1 + t ut (t estad.) (-0,603) (0,0385) (-3,338)
R2 = 0, 433
4. Dada la evidencia obtenida en los apartados anteriores, explica qu consecuencias tiene en: e a) Las propiedades para muestras nitas del estimador de los coecientes del modelo. Razona y demuestra tu respuesta. 149
SARRIKO-ON 04/10
Anlisis de datos a
b) La inferencia utilizando los estad sticos t mostrados en la ecuacin (3.13). Razona tu o respuesta. 5. Cambiar tu respuesta al apartado anterior si el problema detectado fuera consecuencia de a omitir alguna variable relevante? Razona tu respuesta. 6. Considera la siguiente informacin y completa lo que falta. o SCR siendo SCR =
t=....
-0,99 15,9
-0,9 14,8
-0,8 14,2
-0,7 14,1
-0,6 14,7
t=....
-0,5 15,8
-0,4 17,5
-0,3 19,9
-0,2 22,8
-0,1 26,2
0,0 30,3
0,1 34,9
{(Yt 1 X1t 2 X2t }2

X2t = ....................
(3.14)
Yt = Ct Ct1 ;
X1t = ....................;
= .................. .................. 2 .................. ..................
.................. ..................
a) Qu mtodo de estimacin se est utilizando? e e o a b) Cmo obtendr las estimaciones nales de 1 y 2 por este mtodo? Indica el valor o as e elegido de razonando tu eleccin y la frmula para obtener el estimador de 1 y 2 o o Qu propiedades tienen los estimadores obtenidos de estos parmetros? e a c) Cmo contrastar H0 : 2 = 1? Indica todos los elementos del estad o as stico de contraste, as como la regla de decisin. o d ) Explica las diferencias entre el mtodo anterior y el de Cochrane-Orcutt. e
Ejercicio M-A.3 Consideremos los siguientes datos anuales desde 1990 a 2001 observados para las variables Y y X: Y X 6 -4 3 -3 1 -2 1 -1 1 1 4 2 6 3 16 4 25 5 36 6 49 7 64 8
Se propone la estimacin de una relacin lineal entre estas dos variables donde el trmino de pero o e turbacin sigue un AR(1): o Yt = 1 + 2 Xt + ut 150 ut = ut1 + t
Anlisis de datos a
SARRIKO-ON 04/10 Estimacin MCO, usando las observaciones 1990-2001 (T = 12) o Variable dependiente: Y Coeciente const X 8,01220 4,45591 Desv. T pica 4,05896 0,91917 1501,071 0,853150 Estad stico t 1,9740 4,8477 R2 corregido DurbinWatson Valor p 0,0766 0,0007 0,671647 0,321828
1. Contrasta la hiptesis nula de no autocorrelacin utilizando el valor muestral del estad o o stico de Durbin-Watson. 2. Calcula los residuos de la estimacin por MCO y usalos para obtener una estimacin inicial o o del coeciente de autocorrelacin de orden uno suponiendo que el trmino de perturbacin o e o sigue un AR(1). Coincide con el valor mostrado en los resultados anteriores? 3. Calcula los datos de las variables del modelo transformado: (Yt Yt1 ) = 1 (1 ) + 2 (Xt Xt1 ) + t 4. Obtn las estimaciones de 1 y 2 por el mtodo de Cochrane-Orcutt sin realizar ninguna e e iteracin. o 5. Calcula la estimacin de la matriz de varianzas y covarianzas de los estimadores obtenidos en o el apartado anterior. 6. Contrasta la signicatividad de la variable X.
3.8.
Prcticas de Aula a
En el tema de autocorrelacin es habitual disponer de una prctica de aula, lo que equivale a una o a hora de clase presencial y dos horas de trabajo personal. Si el ejercicio ha sido realizado previamente por el alumno, el tiempo es suciente para su correccin y solucin de dudas existentes en clase. o o Las competencias a trabajar en esta prctica de aula son: a 1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e Recordatorio: Las prcticas de aula son clases participativas, ello quiere decir que el alumno dea be acudir a clase con el ejercicio realizado en su tiempo de trabajo personal. Previamente y con anticipacin suciente se le habr realizado la debida propuesta. Durante la clase se preguntar aleao a a toriamente a los alumnos sobre lo realizado.
151
SARRIKO-ON 04/10 Prctica de Aula PA-A.1: a
Anlisis de datos a
Un investigador dispone de una base de datos anuales1 , para el per odo de 1948 a 1993, de los siguientes ndices agrarios de EEUU, todos ellos con base 1982: output labor land machines : : : : produccin agr o cola (Rango 51 - 116) mano de obra agr cola (Rango 81 - 278) supercie utilizada en la produccin agr o cola (Rango 89 - 102) maquinaria (duradera) (Rango 38 - 102)
El objetivo del investigador es determinar la funcin de produccin agraria, para ello especica el o o siguiente modelo de regresin lineal: o outputt = 1 + 2 labort + 3 landt + 4 machinest + ut t = 1, . . . , T (3.15)
en el que se considera que los regresores son no estocsticos. Los resultados obtenidos de la estimacin a o MCO son los que se muestran a continuacin: o
outputt = 181, 201 0, 307 labort 0, 517 landt 0, 096 machinest (40,194) (0,038) (0,564) (0,169) M CO )) (des( R2 = 0, 884 DW = 0, 612 SCR = 1885, 08 T = 46
output observada y estimada 120 estimada observada 110 10 100 5 90 residuo output 15
Residuos de la regresin (= output observada estimada)
80
70 5 60 10 50
40 1950 1955 1960 1965 1970 1975 1980 1985 1990
15 1950 1955 1960 1965 1970 1975 1980 1985 1990
1. Explica cmo se han calculado los residuos y para qu sirven los grcos. Interpreta ambos o e a grcos y seala si existe alguna evidencia de que la perturbacin del modelo no cumpla a n o alguna de las hiptesis bsicas, justicando tu respuesta. o a 2. Realiza algn contraste basndote en la informacin disponible, para cualquier problema deu a o tectado en el apartado anterior. Explica detalladamente todos los elementos que intervengan.
1 Fichero data9-5.gdt, disponible en gretl pestaa Ramanathan. Recogido en Ramanathan, R. (2002), Introductory n Econometrics with Applications, 5th. edn., South-Western.
152
Anlisis de datos a
SARRIKO-ON 04/10
3. Con respecto a los contrastes de signicatividad individual de las variables explicativas del modelo (3.15): a) Es able realizarlos utilizando la informacin disponible? Por qu? o e b) Ser posible llevarlos a cabo si no tuvisemos otra opcin que la de estimar los coea e o cientes del modelo por MCO? Explica cmo lo har en caso armativo. o as Viendo los resultados obtenidos el investigador decide estimar el mismo modelo por el mtodo e de Cochrane-Orcutt (CO). A continuacin se muestran los resultados obtenidos: o Estimaciones CochraneOrcutt utilizando las 45 observaciones 19491993 Variable dependiente: output = 0.791585 Coeciente const labor land machines 54,3902 0,4046 1,0727 0,2874 Desv. T pica 30,3065 0,0649 0,3741 0,2000 Estad stico t 1,7947 6,2284 2,8673 1,4372 Valor p 0,0801 0,0000 0,0065 0,1583
Estad sticos basados en los datos rho-diferenciados: R2 F (3, 41) 0,957590 12,99460 0,184791 R2 corregido Valor p (de F ) DurbinWatson 0,954487 4,18e06 2,339505
918, 4860 0, 1755 9, 5945 0, 0629 0, 1755 0, 0042 0, 0096 0, 0027 V (CO ) = 9, 5945 0, 0096 0, 1399 0, 0349 0, 0629 0, 0027 0, 0349 0, 0400 4. Cundo ests dispuesto a aplicar este mtodo de estimacin? En particular, consideras a a e o adecuado utilizar este mtodo en las circunstancias actuales? Responde razonadamente. e 5. Describe detalladamente cmo obtener las estimaciones de los coecientes del modelo (3.15) o utilizando el mtodo del apartado anterior. e 6. Con la informacin disponible, realiza el siguiente contraste H0 : 2 = 3 . Escribe la hiptesis o o nula, la alternativa, el estad stico de contraste junto con su distribucin y realiza el contraste. o Cmo interpretas el resultado? o
3.9.
En el tema de autocorrelacin es habitual disponer de una prctica de ordenador que equivale a una o a hora presencial y dos horas de trabajo no presencial para repasar lo visto y repetir la mecnica. A a continuacin se va a proponer un ejercicio para resolver en el centro de clculo. El enunciado cubre o a 153
SARRIKO-ON 04/10
Anlisis de datos a
todo lo aprendido en el tema y se va a marcar la divisin entre las dos horas de clase que conlleva o cada una de las dos prcticas de ordenador. a Las competencias a trabajar en estas prcticas de ordenador son: a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e 3. Utilizar diversas fuentes estad sticas y adquirir destreza en el uso de un software economtrico e para analizar relaciones entre variables econmicas. o Recordatorio: Es conveniente que una vez acabado el ejercicio y en vuestro tiempo de trabajo personal deis contenido al mismo. Es decir, en clase unicamente os da tiempo a aprender la mecni a ca, la ejecucin sucesiva de instrucciones para obtener los resultados pedidos, aunque el profesor va o comentando y explicando los resultados. Vosotros y de forma personal debis redactar conveniene temente las respuestas de cada apartado, en especial los que se recomienda realizar en casa. En el Anexo del tema tenis un resumen de las instrucciones bsicas de gretl para autocorrelacin. e a o Prctica de ordenador PO-A.1 a El chero de datos necesario para la realizacin de esta prctica se encuentra en los archivos de o a muestra de gretl y corresponde al chero Table12-9.gdt de Gujarati2 . Son datos de series temporales correspondientes a los aos 1950 a 1991. De las variables disponibles, se consideran las siguientes: n SALES INVENTS Ventas de la industria manufacturera en EE.UU, en millones de dlares o Inventarios de la industria manufacturera en EE.UU, en millones de dlares. o
1. Estima por MCO el siguiente modelo IN V EN T St = 1 + 2 SALESt + ut Completa utilizando los resultados obtenidos con gretl: IN V EN T S t = ( (des(M CO )) R2 = DW = SCR = Cov(1 , 2 ) = + ) ( ) T = SALESt (3.16)
Coeciente de correlacin entre IN V EN T S y SALES = o Ao t n Residuo ut

2 Fichero Table12-9.gdt, disponible en gretl pestaa Gujarati. Fuente: Economic Report of the President, 1993, Table n B-53, recogida en Ramanathan, R. (2002), Introductory econometrics with applications, 5th. Ed., South-Western.
1950
1951
1952
154
Anlisis de datos a
SARRIKO-ON 04/10
2. Obtn el grco de series temporales de las variables dependiente y explicativa, as como el e a grco de la serie observada y ajustada y el de los residuos. Comntalos. (Los comentarios a a e realizar en casa) 3. Se considera que ut puede seguir un proceso AR(p) o MA(p) con p hasta de orden dos. Realiza el contraste de Breusch-Godfrey utilizando gretl y completa. a) Escribe la hiptesis nula y la alternativa del contraste. o b) Aplica el contraste y completa: Regresin auxiliar obtenida: o ...... = .............................................................................................. R2 = Estad stico y distribucin bajo la hiptesis nula: o o Valor muestral del estad stico = Aplica la regla de decisin para un nivel de signicacin ( = 5 %) o o c) A la vista de los resultados de los contrastes de autocorrelacin DW y Breusch-Godfrey, o son las perturbaciones de modelo esfricas? Por qu? (A completar en casa). e e 4. Estima de nuevo los coecientes del modelo por MCO, pero obtn desviaciones t e picas de los coecientes estimados robustas a la posible existencia de autocorrelacin. Completa. o
(desv .......... (M CO ))
It
= ( )
... ( )
SALESt
Para qu sirven las desviaciones t e picas as obtenidas? Cuando son de utilidad? Explica detalladamente. (A completar en casa) 5. Contrasta la hiptesis conjunta de que en media si las ventas son cero no hay inventarios y o de que un aumento en el nivel de ventas de un milln de dlares aumentar los inventarios o o a en 2 millones y medio de dlares. Escribe la hiptesis nula, la alternativa, el estad o o stico de contraste y su distribucin bajo la nula. (A realizar en casa en detalle) o Prctica de ordenador PO-A.2 a En esta sesin vamos a continuar trabajando con el chero de datos que utilizamos en la o prctica de ordenador PO-A.1. Previamente recordaremos lo realizado en aquella prctica a a y se preguntar aleatoriamente a los alumnos sobre los apartados que hab que realizar en a a casa. 155
SARRIKO-ON 04/10
Anlisis de datos a
6. Considera estimar el modelo (3.16) utilizando el mtodo de Cochrane-Orcutt bajo el supuesto e de que ut sigue un proceso AR(1). Completa la funcin de regresin muestral obtenida, la estimacin de y el valor m o o o nimo de la funcin criterio. o
= ( (des(CO ))
... ) ( )
... ( )
valor minimo de SCR =
7. Explica en detalle cmo se han obtenido las estimaciones por este mtodo. (A completar en o e casa) 8. Considera estimar el modelo (3.16) utilizando el mtodo de Hildreth-Lu bajo el supuesto de e que ut sigue un proceso AR(1). Completa la funcin de regresin muestral obtenida, la estimacin de y el valor m o o o nimo alcanzado para la funcin criterio. o = ( (des(HL )) = ... ) ( ) ... ( )
valor minimo de SCR =
Dibuja el grco de la funcin criterio para cada valor de . a o 9. Explica en detalle cmo se han obtenido las estimaciones por este mtodo. (A realizar en casa) o e 10. Utilizando uno de los dos mtodos anteriores, contrasta de nuevo la hiptesis conjunta de que e o en media si las ventas son cero no hay inventarios y de que un aumento en el nivel de ventas de un milln de dlares aumentar los inventarios en 2 millones y medio de dlares. o o a o 11. Dieren las conclusiones del contraste de las obtenidas anteriormente? Es posible que esto ocurra? Cual ser ms adecuado? (A realizar en casa) a a
3.10.
En el tema de autocorrelacin en general se lleva a cabo un taller. El objetivo del taller es analizar o una serie de resultados en la estimacin de varias especicaciones de un modelo e ir practicando o en la toma de decisiones y la redaccin apropiada de conclusiones. Por ello vamos a proponer un o taller utilizando lo ya trabajado en las prcticas de ordenador y cuyo enunciado se habr repartido a a previamente. De esta forma el alumno ya est familiarizado con el problema a analizar y se pueden a trabajar ms en detalle las siguientes competencias: a 156
Anlisis de datos a
SARRIKO-ON 04/10
1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e 4. Elaborar en grupos de trabajo y exponer en pblico un proyecto emp u rico, donde se valore adecuadamente los resultados obtenidos del anlisis de un modelo economtrico. a e
El ejercicio debe resolverse en equipo, idealmente en el grupo en que se va a realizar el proyecto. Esto favorece la interrelacin y conocimiento entre sus miembros. En los ultimos 15 minutos de o clase, un representante de cada equipo deber de exponer al resto de la clase la decisin adoptada a o por el grupo junto a las razones consideradas.
Enunciado del taller: Objetivo: Analizar los resultados de la estimacin de un modelo por diferentes mtodos para o e los inventarios . Elegir entre ellos utilizando diferentes contrastes de especicacin. o Informacin: Son datos del periodo 1950 a 1991 de las siguientes variables: o SALES INVENTS Ventas de la industria manufacturera en EE.UU. en millones de dlares o Inventarios de la industria manufacturera en EE.UU. en millones de dlares o
Procedimiento: Debis analizar la informacin disponible y decidir cul es la especicacin e o a o ms adecuada junto con su correcta estimacin. a o ESPECIFICACION A: Se propone la siguiente relacin: o IN V EN T St = 1 + 2 SALESt + ut (3.17)
Estimacin 1 de la ESPECIFICACION A: Los resultados de la estimacin MCO son los o o siguientes: Estimaciones MCO utilizando las 42 observaciones 19501991 Variable dependiente: INVENTS Variable const SALES Coeciente 1668,67 1,5543 Desv. t pica 1806,70 0,0069 157 Estad stico t 0,9236 222,5282 valor p 0,3612 0,0000
SARRIKO-ON 04/10 Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de los residuos ( ) R2 R2 corregido Grados de libertad Estad stico de DurbinWatson Coef. de autocorr. de primer orden. 311725,00 259140,00 2,22224e+09 7453,59 0,99910 0,999173 40 1,37460 0,31100
Anlisis de datos a
Matriz de covarianzas de los coecientes const 3, 26415e+06 SALES 9, 7322 4, 87883e-05 const SALES
Coecientes de correlacin, usando las observaciones 1950 - 1991 o valor cr tico al 5 % (a dos colas) = 0,3044 para n = 42 SALES 1, 0000 INVENTS 0, 9996 1, 0000 SALES INVENTS
Adems, se dispone de la siguiente regresion auxiliar: a ut = 90, 048 0, 000627 V EN T ASt + 0, 287394 ut1 + 0, 08407 ut2 R2 = 0, 103545 1. Analizar TODA la informacin proporcionada. Debis decidir si esta especicacin junto con o e o su mtodo de estimacin es la ms adecuada. Debis razonar en qu medida estos resultados e o a e e son ables. Estimacin 2 de la ESPECIFICACION A: o Se estiman de nuevo los coecientes de la ESPECIFICACION A por MCO, pero se utilizan desviaciones t picas de los coecientes estimados robustas a la posible existencia de autocorrelacin. o Se obtienen los siguientes resultados: Estimaciones MCO utilizando las 42 observaciones 19501991 Variable dependiente: INVENTS Desviaciones t picas HAC, con ancho de banda 2 (Kernel de Bartlett) Coeciente Desv. t pica Estad stico t 1668,67 1,5543 1094,77 0,0083 158 1,5242 187,2301 t = 3, . . . , 42
Variable const SALES
valor p 0,1353 0,0000
Anlisis de datos a Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de los residuos ( ) R2 R2 corregido Grados de libertad Estad stico de DurbinWatson Coef. de autocorr. de primer orden. Conjunto de restricciones Estad stico de contraste b[const] = 0 b[SALES] = 2,5 F robusto(2, 40) = 9272,21 valor p = 4,55217e-054
SARRIKO-ON 04/10 311725,00 259140,00 2,22224e+09 7453,59 0,99910 0,99910 40 1,374607 0,3110
2. Analizar la informacin proporcionada. En particular deber razonar sobre en qu medida o as e y para qu n estos resultados son ables. Qu concluyes? e e ESPECIFICACION B: El estudiante considera la inclusin de la variable time = 1, 2, . . . , 42 en el modelo y especica o la siguiente ecuacin: o IN V EN T St = 1 + 2 SALESt + 3 time + ut y realiza las siguientes estimaciones: Estimacin 1 de la ESPECIFICACION B: o Estimaciones MCO utilizando las 42 observaciones 19501991 Variable dependiente: INVENTS Desviaciones t picas robustas a autocorrelacin o Variable const SALES time Coeciente 433,9510 1,5434 158,8050 Desv. t pica 1143,3800 0,0136 169,2250 Estad stico t 0,3795 113,3700 0,9384 2,20257e+09 0,999200 0,999159 18497,7 1,375590 0,311486 valor p 0,7064 0,0000 0,3538 t = 1, . . . , 42
Suma de cuadrados de los residuos R2 R2 corregido F (2, 39) Estad stico de DurbinWatson Coef. de autocorr. de primer orden.
159
SARRIKO-ON 04/10 Estimacin 2 de la ESPECIFICACION B: o Realizando el clculo iterativo de rho... a ITERACION RHO SCR 1 0,31149 1,9874e+009 2 0,31600 1,98735e+009 nal 0,31616
Anlisis de datos a
Estimaciones CochraneOrcutt utilizando las 41 observaciones 19511991 Variable dependiente: INVENTS = 0,316161 Coeciente const SALES time 34,3714 1,5375 229,7630 Desv. t pica 4413,7100 0,0289 410,6420 estad stico t 0,0078 53,1693 0,5595 valor p 0,9938 0,0000 0,5791
Estad sticos basados en los datos rho-diferenciados: Suma de cuadrados de los residuos R2 R2 corregido F (2, 38) Estad stico de DurbinWatson Coef. de autocorr. de primer orden. 1,98735e+09 0,999261 0,999222 12476,9 2,050180 0,027528
3. Por qu crees que el estudiante ha introducido la variable tendencia (time) como regresor e en el modelo? Es relevante incluirla? Por qu crees que se obtiene ese resultado? Utiliza los e contrastes que consideres oportunos. Razona tu respuesta. (A completar en casa) 4. Ayuda al estudiante a decidir sobre la abilidad de los distintos resultados de estimacin mostrados de la especicacin B. Razona tu respuesta en base a la informacin o o o proporcionada. 5. Debis decidir qu especicacin A o B y mtodo de estimacin es la ms adecuada. Analizar la e e o e o a informacin proporcionada por los resultados de la estimacin. Consejo: empezar por escribir o o la funcin de regresin poblacional que se est estimando e indicar cules son los supuestos o o a a sobre la perturbacin que se han asumido. Analizar su coherencia dada TODA la informacin o o disponible hasta este momento. Finalmente, tomad una decisin. o
3.11.
Evaluativas - Preguntas cortas
Se recuerda que dado que el curso contempla la evaluacin continua es necesario que a lo largo o del tema se evale a los alumnos, tanto en las clases magistrales, como en las prcticas de aula y u a ordenador. Se llevan a cabo en clase y de manera individual. A modo de ejemplo se incluyen las siguientes. 160
Anlisis de datos a Preguntas cortas en Clases Magistrales: Al estimar el modelo Yt = 1 + 2 X2t + 3 X3t + ut t = 1, . . . , 73
SARRIKO-ON 04/10
donde la matriz de regresores X es no estocstica, se ha obtenido un valor del estad a stico DurbinWatson igual a 0,468. Pc.1 Escribe la frmula del estad o stico de Durbin Watson. Hay evidencia de autocorrelacin en el o trmino de perturbacin del modelo? (Al 5 %, di = 1, 56 y ds = 1, 67) e o Pc.2 Escribe la regresin auxiliar y el estad o stico de Breusch Godfrey para contrastar la existencia de un proceso AR(1) o MA(1) en el trmino de perturbacin. e o Pc.3 Es compatible obtener un valor del estad stico de Breusch-Godfrey de 0,2474 dado el valor obtenido del estad stico de Durbin Watson anterior? Por qu? (2 e 1|0,05 = 3, 84) Pc.4 Cual de los siguientes grcos es compatible con la evidencia del valor muestral del estad a stico de Durbin-Watson? Y con la del de Breusch-Godfrey?
AR(1) con coeficiente negativo 0.95
1.5 1.0
AR(1) con coeficiente positivo 0.95
0.5
1.0
Residuos
Residuos 0 10 20 30 t 40 50 60
0.0
0.5
1.0
1.5
1.5 0
1.0
0.5
0.0
0.5
10
20
30 t
40
50
60
Ruido blanco (var=0.16)
Residuos
1.0 0
0.5
0.0
0.5
10
20
30 t
40
50
60
Pc.5 Escribe el correspondiente modelo con perturbaciones esfricas considerando que el valor del e coeciente de autocorrelacin de orden uno de el trmino de perturbacin del modelo de inters o e o e es 0,7. Escribe expl citamente la frmula del estimador eciente. o
161
SARRIKO-ON 04/10 Preguntas cortas en Prcticas de Aula: a Se propone el siguiente modelo para la oferta de caf en Colombia: e ln(Qt ) = + ln(Pt ) + ut
Anlisis de datos a
donde Q es el rea dedicada a la plantacin de caf y P es el precio del producto en el mercado. Se a o e dispone de 34 observaciones anuales de Q y P . La estimacin MCO es: o ln(Qt ) = 5, 1 + 0, 85 ln(Pt ) (0,20) (0,23) (des) R2 = 0, 86 (R1)
Se han realizado las siguientes regresiones basadas en los residuos MCO, u: ut = 0, 02 + 0, 012 ln(Pt ) + 0, 34t1 u e2 t e2 t e2 t = 1, 32 0, 02t = 5, 20 0, 1t + 1, 74 ln(Pt ) = 5, 74 0, 11t + 1, 87 ln(Pt ) 0, 18vt1 R2 = 0, 116 SCR = 2, 7 SCR = 2, 61 SCR = 42, 76 SCR = 41, 21 R2 R2 R2 R2 = 0, 023 SCR = 46, 48 = 0, 10 = 0, 13
ut = 0, 38 + 0, 01t 0, 18 ln(Pt ) + 0, 32t1 R2 = 0, 13 u
et = 0, 22 + 0, 01t et = 3, 59 + 0, 08t 1, 51 ln(Pt ) et = 0, 51 0, 009t + 0, 17 ln(Pt ) 0, 18et1 con et = ut / y 2 = 2 t ut /34.
= 0, 001 SCR = 378, 62 SCR = 0, 33
R2 = 0, 009 SCR = 375, 82 R2 = 0, 13
a) Contrasta si existe autocorrelacin en el modelo. Indica claramente la hiptesis nula y la o o alternativa, la regresin auxiliar utilizada, el estad o stico de contraste y su distribucin bajo la o hiptesis nula. o Posteriormente se han obtenido las siguientes estimaciones por MCGF: ln(Qt ) (des()) = 5, 98 + 0, 89 ln(Pt ) (0,16) (0,13) SCR = 3, 052 t = 0, 30/ t (R2)
ln(Qt ) (des())
5, 82 + 1, 21 ln(Pt ) (0,3) (0,9)
SCR = 5, 620
t = 5, 066 t
(R3)
ln(Qt ) (des())
6, 04 + 0, 91 ln(Pt ) (0,22) (0,11)
SCR = 2, 642
ut = 0, 34t1 + et u
(R4)
ln(Qt ) (des())
6, 21 + 0, 96 ln(Pt ) (0,28) (0,15)
SCR = 2, 532 ut = 0, 36t1 + 0, 002t2 + et u u
(R5)
162
Anlisis de datos a
SARRIKO-ON 04/10
b) Interesa saber si la elasticidad-precio es cero. Explica cmo lo contrastar indicando clarao as mente el estimador que utilizas y cmo se ha obtenido. Utiliza la informacin anterior para o o realizar el contraste. Preguntas cortas en Prcticas de Ordenador: a Accede al conjunto de datos 9-7.gdt del libro de Ramanathan3 incluido en gretl. Son datos trimestrales desde el primer trimestre de 1975 al cuarto trimestre de 1990. Considera el siguiente subconjunto de variables de este chero: QNC PRICE INCOME Nmero de coches nuevos vendidos (en miles de dlares). u o Indice de precios medios en trminos reales de un coche nuevo. e Renta personal disponible per capita en miles de dlares. o
Para el modelo: QNCt = 1 + 2 PRICEt + 3 INCOMEt + ut t = 1, . . . , 64
1. Obtn el grco de los residuos contra el tiempo. Comenta el grco. e a a 2. Dado que son datos trimestrales, contrasta la posibilidad de que ut siga un proceso autorregresivo o de medias mviles de orden 4, utilizando el estad o stico de Breusch-Godfrey. Completa: a) H0 : Ha :
b) Estad stico de contraste y distribucin: o
c) Regresin auxiliar: o
d ) Regresin auxiliar estimada: o
e) Computa el estad stico de contraste y lleva a cabo el contraste:
3 Fichero 9-7.gdt, disponible en gretl pesta a Ramanathan. Recogido en Ramanathan, R. (2002), Introductory n Econometrics with Applications, 5th. edn., South-Western.
163
SARRIKO-ON 04/10
Anlisis de datos a
3.12.
Referencias Bibliogrcas Bsicas: a a Terica: o [1] Greene, W. (1998), Anlisis Economtrico, ed. Prentice Hall, 3a edition. a e [2] Ramanathan, R. (2002), Introductory Econometrics with applications, ed. South-Western, 5th edition. [3] Wooldridge, J. M. (2003), Introductory Econometrics: A modern Approach, ed. South-Western, 2nd edition. Ejercicios: [1] Alegre, J., Arcarons, J., Bolanc, C. y D L. (1995), Ejercicios y Problemas de Econometr e az, a, Coleccin Plan Nuevo, ediciones AC. o [2] Fernndez, A., Gonzlez, P., Reglez, M., Moral, P., Esteban, V. (2005), Ejercicios de Econoa a u metr ed. McGraw-Hill, 2 a edicin. a, o [3] Recopilacin de ejercicios recomendados y exmenes de Econometr Departamento de Econom o a a. a Aplicada III (Econometr y Estad a stica). Mimeo Febrero 2009. Disponible en Lankopi. Ejercicios con gretl: [1] Ramanathan, R. (2002) Instructors Manual to accompany, del libro Introductory Econometrics with applications, ed. South-Western, 5th edition, Harcourt College Publishers. [2] Wooldridge, J. M. (2003), Student Solutions Manual, del libro Introductory Econometrics: A modern Approach, ed. South-Western, 2nd edition. Referencias Bibliogrcas Complementarias: a [1] Alonso, A., Fernndez, J. y Gallastegui, I. (2005), Econometr ed. Pearson: Prentice Hall. a a, [2] Gujarati, D. (2004), Econometr ed. McGraw-Hill, 4a edicin. a, o [3] Johnston, J. (1984), Mtodos de Econometr ed. Vicens Vivens, 4a edicin. e a, o [4] Maddala, G. S. (1996), Introduccin a la Econometr ed. Pearson: Prentice Hall. o a, [5] Novales, A. (1993), Econometr ed. McGraw-Hill, 2a edicin. a, o [6] Pindyck, R. S. y Rubinfeld, D. L. (1998), Econometric Models and Economic Forecast, ed. McGraw-Hill, 4a edicin. o
164
Anlisis de datos a
SARRIKO-ON 04/10
3.13.
Anexo: Instrucciones bsicas de gretl para autocorrelacin a o
En este anexo vamos a indicar las instrucciones bsicas para poder realizar la prctica de ordenador a a del tema. En el anexo del tema anterior ya se han explicado las generales, por lo que nos centraremos solamente en las espec cas de autocorrelacin. o Contrastes de Autocorrelacin: El programa gretl tiene implementados varios contrastes de o autocorrelacin. o - El estad stico de Durbin-Watson se muestra en los resultados de las estimacin por MCO. o Para realizar el contraste de Durbin-Watson, hay que obtener los valores de las cotas inferior y superior tabuladas al 5 % para un tamao muestral dado n, por ejemplo 72 observaciones. n En la ventana principal hay que elegir Herramientas Tablas estad sticas DW se completa el tamao muestral n = 72 y el nmero de regresores del modelo, excluyendo el trmino n u e constante, por ejemplo 2. Se muestran las cotas inferior di dL y superior ds dU , de la siguiente forma: Valores crticos al 5% del estadstico de Durbin-Watson, n = 72, k = 2 dL = 1,5611 dU = 1,6751 - El contraste de Breusch-Godfrey se puede obtener en la pantalla de resultados de la estimacin o MCO. Pulsar: Contrastes Autocorrelacin Seleccionar el nmero de retardos p de la hiptesis alternao u o tiva Al realizar la regresin auxiliar gretl usa todas las observaciones, incluidas las primeras p o igualando aquellos retardos de los residuos no disponibles u0 , . . . , u1p a cero. Por supuesto puedes obtener el valor del estad stico de contraste siguiendo todos los pasos aprendidos en clase. Veamos como realizar expl citamente y paso a paso el contraste de Breusch-Godfrey: 1. Se estima el modelo de inters por MCO Modelo M e nimos Cuadrados Ordinarios 2. Se guardan los residuos Guardar residuos en la ventana de estimacin del modelo. o 3. Se realiza la regresin auxiliar tal y como se ha explicado en la clase magistral. Si no o se consideran todas las observaciones, simplemente se realiza la estimacin por MCO o eligiendo como variable dependiente la que se ha denido para guardar los residuos y como variables explicativas los regresores del modelo de inters. Adems, para incluir e a como regresores los p retardos de los residuos: en la ventana gretl:especicar modelo elegir retardos y en la que surge elegir los retardos que se deseen, de 1 a p de la variable dependiente. 4. Se guarda el valor del coeciente de determinacin R2 de esa regresin auxiliar y se o o multiplica por el nmero de observaciones disponibles para el clculo del estad u a stico. 165
SARRIKO-ON 04/10
Anlisis de datos a
Estimar de forma consistente la matriz de varianzas y covarianzas de los coecientes estimados por MCO robusto a autocorrelacin. o La estimacin de los coecientes del modelo es por MCO, pero su matriz de varianzas y covarianzas o se estima teniendo en cuenta que hay autocorrelacin para que la inferencia usando los estad o sticos t y F sea adecuada: Modelo M nimos Cuadrados elegir la variable dependiente y las variables independientes Elegir en esa misma ventana desviaciones t picas robustas, y en congurar elegir HAC. De esta forma podemos hacer los contrastes de signicatividad individual con los valores de los estad sticos t que nos muestra el output eligiendo el valor cr tico en la distribucin N(0,1). Cualquier o otro contraste de restricciones lineales los podemos realizar eligiendo en la ventana de estimacin o Contrastes Restricciones lineales. El programa gretl considera para realizar el contraste el estimador robusto a autocorrelacin de la matriz de varianzas y covarianzas de los coecientes estimados o por MCO. Estimar la especicacin del modelo por el mtodo de Cochrane-Orcutt. o e Modelo Series Temporales Cochrane-Orcutt En la ventana de resultados se muestra el valor de rho y la SCR del modelo transformado para cada iteracin, hasta el valor nal alcanzado el criterio de convergencia que por defecto usa gretl. A su o vez, se muestran los resultados de la estimacin del modelo original por este mtodo. Tambin se o e e muestran una serie de estad sticos basados en los datos rho-diferenciados. Hay que ser cautelosos en la interpretacin de estos resultados, ya que se reeren al modelo transformado y no al original. o Este modelo tiene regresores estocsticos ya que para la transformacin se utiliza la estimacin del a o o parmetro . Por lo tanto, el valor del estad a stico Durbin-Watson no es comparable con las cotas tabuladas bajo el supuesto de regresores no estocsticos. a Cualquier contraste de restricciones lineales utilizando este estimador lo podemos realizar eligiendo en la ventana de estimacin Contrastes Restricciones lineales o Estimar la especicacin del modelo por el mtodo de Hildreth-Lu o e Modelo Series Temporales Hildreth-Lu En la ventana de resultados se muestra el valor de rho en la red para la cual la SCR es m nima junto con los resultados de la estimacin de los parmetros del modelo original. Adiccionalmente, o a se muestra en una nueva ventana la funcin a minimizar que es la Suma de Cuadrados de Residuos o (SCR) del modelo transformado para distintos valores de rho en la red.
166
Anlisis de datos a Tratamiento de los retardos en gretl. - Aadir retardos de una variable en concreto a la ventana principal. n Aadir Retardos de las variables seleccionadas n
SARRIKO-ON 04/10
En la ventana que surge poner el nmero de retardos que se quiere aadir. El problema est en u n a que estos retardos no aparecern en las ventanas de estimacin del modelo por MCO o por a o otro tipo de mtodos. e Otra forma ser Aadir Denir nueva variable a n En la ventana que surge denir el retardo de la variable deseada, por ejemplo de la variable RD el retardo 4 ser RD4 = RD(4) a Entre parntesis el nmero de retardo deseado se acompaa con el signo menos. e u n Vemos los datos de esas variables Obs 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 RD 57,94 60,59 64,44 70,66 76,83 80,00 84,82 86,84 88,81 88,28 RD4
57,94 60,59 64,44 70,66 76,83 80,00
La primera columna ser RDt y la segunda RDt4 . a - Aadir retardos de la variable dependiente o de los regresores y usarlos en la estimacin. En n o este caso se aadirn en la misma ventana de estimacin: n a o En la ventana gretl: especicar modelo elegir retardos y en la que surge elegir los retardos que se deseen, bien de forma continua o retardos espec cos de forma discontinua, tanto de la variable dependiente como de las variables explicativas que se han denido previamente.
167
SARRIKO-ON 04/10
Anlisis de datos a
168
Tema 4
Regresores Estocsticos a
Clases Magistrales
En las clases magistrales del tema de Regresores Estocsticos vamos a relajar una de las hiptesis a o bsicas de trabajo en el Modelo de Regresin Lineal General. Vamos a considerar que la matriz a o de regresores X es estocstica. Bajo este nuevo panorama hemos de revisar las propiedades del a estimador de MCO y cmo realizar inferencia vlida. o a En un contexto de regresores estocsticos la validez del estimador MCO depende de la existencia a o no de correlacin entre X y la perturbacin del modelo. Si esta correlacin existe el estimador o o o de MCO no es consistente y nos vemos en la necesidad de proponer un estimador alternativo que s ser consistente, el estimador de Variables Instrumentales, VI. Es claro que es fundamental saber a cundo existe correlacin estad a o sticamente signicativa entre la perturbacin y el o los regresores o estocsticos. Para ello utilizaremos el contraste de Hausman. a Dedicaremos un total de siete clases magistrales a analizar la importancia de que los regresores sean estocsticos y utilizar el estad a stico de Hausman; a desarrollar el estimador de VI, probar sus propiedades y obtener en la prctica al estimador as como a mostrar cmo hacer inferencia a o en este nuevo marco de trabajo. Aproximadamente, tres horas se dedican a resolver ejercicios. Se resolvern las dudas surgidas y se realizaran preguntas al alumno sobre los contenidos vistos, en a muchas ocasiones en forma de preguntas cortas que se recogen y evalan convenientemente. u
Competencias a trabajar en estas sesiones: 1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e
169
SARRIKO-ON 04/10 Al nal de este tema deber ais ser capaces de: 1. Explicar por qu si X es estocstica, el estimador MCO no es lineal en u. e a 2. Explicar las consecuencias de la no linealidad del estimador de MCO.
Anlisis de datos a
3. Explicar qu implicaciones tiene en el estimador de MCO, y sus propiedades, el que los regree sores estn correlacionados con el trmino de perturbacin del modelo de inters. a e o e 4. Describir las propiedades de una variable instrumental. Conocer para qu son necesarias. e 5. Estimar utilizando el estimador de Variables Instrumentales bajo los dos casos posibles: cuando el nmero de instrumentos es igual, o cuando es mayor, al nmero de variables que lo necesitan. u u 6. Utilizar el estimador de VI para realizar inferencia. 7. Utilizar el estad stico de Hausman para detectar correlacin entre regresores estocsticos y o a perturbacin. o
Bibliograf Recomendada: a Al nal del tema tenis recogida la bibliograf correspondiente. En particular os recomendamos e a leer los cap tulos correspondientes a la bibliograf bsica detallados a continuacin: a a o Greene, W. (1998), cap. 4, cap. 6, cap. 9 y cap. 17. Ramanathan, R. (2002), cap. 2, cap. 10 y cap 13. Wooldridge, J. M. (2003), cap. 5, cap. 9. y cap. 15. Y para profundizar, podis leer los cap e tulos detallados a continuacin correspondientes a la biblioo graf complementaria: a Alonso, A. et al. (2005), cap. 8 y cap. 11. Gujarati, D. (2004), cap. 13 y cap. 17. Johnston, J. (1984), cap. 9 y cap. 10. Maddala, G. S. (1996), cap. 9 y cap. 11. Novales, A. (1993), cap. 2, cap. 9 y cap. 10.
170
Anlisis de datos a
SARRIKO-ON 04/10
4.1.
Introduccin o
En los temas anteriores hemos mantenido el supuesto bsico sobre los regresores, de que X era a una matriz de variables explicativas no estocsticas o jas. Este supuesto es apropiado para exa perimentos controlados o de laboratorio, para variables como la tendencia o variables cticias, o cuando trabajamos condicionando a una muestra dada. En este tema relajaremos dicho supuesto para adecuarnos a situaciones en las que este supuesto no sea razonable. Objetivo del tema: Relajar la hiptesis bsica de que X es una matriz de variables no estocsticas o a a considerando que X es una matriz estocstica. Para ello basta con que uno de los regresores incluidos a en X sea estocstico. a En este tema analizaremos si los mtodos de estimacin e inferencia vistos hasta ahora son vlidos e o a cuando X es estocstica. En caso de que no sea as analizaremos qu mtodos alternativos estn a e e a disponibles. Si X es una matriz de regresores estocsticos, el estimador MCO de , es una funcin estocstica a o a no lineal de X y u y por tanto, sus propiedades dependen de la distribucin conjunta de ambas o variables. Esto dicultar, en general, el conocimiento de las propiedades en muestras nitas de este a estimador y sus propiedades asintticas dependern de la relacin entre X y u. En consecuencia o a o tambin se ver afectada la inferencia. e a Para ilustrar alguna de estas situaciones vamos a considerar los siguientes ejemplos: Ejemplo 4.1 Sea el siguiente modelo de regresin para explicar la productividad de un trabajador, o Yt , medida como nmero de piezas realizadas en el d u a: Yt = 1 + 2 Xt + ut
2 ut N (0, u )
t = 1, 2, . . . , T
siendo Xt la habilidad de un trabajador, variable no observable ya que es dif de cuanticar. En su cil lugar observamos la variable Xt aos de experiencia del trabajador en el puesto de trabajo, y vamos n a utilizarla para aproximar la habilidad del trabajador1 . Es probable que cuanto ms antigedad a u tenga en el puesto el trabajador, ms hbil sea y viceversa, as que parece sensato suponer que a a existe relacin entre ambas variables. Sin embargo, la aproximacin no ser exacta, conllevar un o o a a error de medida. Ser tal que: a Xt = Xt + vt
2 vt N (0, v )
Cov(ut , vt ) = 0 t
t = 1, 2, . . . , T
donde vt es una v.a. que recoge el error de medida en t y se le supone independiente de ut . En esta a situacin, Xt es una v.a. aunque consideremos a Xt como no estocstica. El modelo estimable en o trminos de la variable observable ser e a: Yt = 1 + 2 (Xt vt ) + ut Yt = 1 + 2 Xt + (ut 2 vt ) Yt = 1 + 2 Xt + ut
1
A una variable que aproxima a otra en la literatura Economtrica se le denomina variable proxy. e
171
SARRIKO-ON 04/10
Anlisis de datos a
llamamos ut = (ut 2 vt ), en este caso ut es una funcin de ut y vt , luego de Xt ; por ello, no o tendr sentido realizar un anlisis condicionado a unos valores jos de X matriz de regresores. En a a el modelo estimable 2 E(Xt ut ) = E[(Xt + vt )(ut 2 vt )] = 2 v = 0 por lo que, el Teorema de Mann y Wald no se cumple. El estimador MCO ser inconsistente y es a necesario encontrar un mtodo de estimacin consistente alternativo. Este caso lo analizaremos en e o profundidad ms adelante y es conocido en la literatura como errores en variables. En este supuesto a la variable medida con error es la variable explicativa. Ejemplo 4.2 Supongamos que se quiere estimar los coecientes de la siguiente ecuacin de deo manda de un bien: Qt = 1 + 2 Pt + ut t = 1, 2, . . . , T donde Q es la cantidad demandada y P es el precio. Dado que en el momento t observamos la cantidad y precio de equilibrio, ambas variables se determinan simultneamente en el mercado. a Luego, tanto Q como P son variables endgenas. Si en t se produce un shock en la demanda del o bien debido, por ejemplo, a un cambio en los gustos de los consumidores, al ser recogido por ut , se genera un cambio tanto en la cantidad demandada como en el precio. En este contexto dado que las variables se determinan simultneamente ambas son aleatorias. Este es otro ejemplo donde la a matriz de regresores es estocstica y no tiene sentido realizar el anlisis condicionado a valores jos a a de Pt t = 1, 2, . . . , T , dado que Pt se determina simultneamente a Qt . Volveremos a retomar este a ejemplo ms adelante. a a a Ejemplo 4.3 Supongamos un modelo con dinmica en la parte sistemtica porque incluye como regresor a la variable endgena retardada. Por ejemplo, si estudiamos la funcin de consumo es o o muy posible que estemos dispuestos a aceptar que, adems de la renta actual, Rt un regresor, a posiblemente relevante, para explicar el consumo actual, Ct sea el consumo del per odo anterior, Ct1 : Ct = 1 + 2 Ct1 + 3 Rt + ut t = 2, . . . , T En este caso la matriz de regresores del modelo es estocstica ya que incluye como regresor a un rea tardo de la variable endgena, variable estocstica y no tiene sentido realizar el anlisis condicionado o a a a valores jos.
Es necesario revisar los resultados obtenidos para el MRLG bajo el supuesto de que X es una matriz de regresores estocsticos. Comenzaremos revisando la validez del estimador MCO bajo diferentes a supuestos de relacin entre X estocstica y u. o a
4.2.
Propiedades del estimador MCO
En presencia de regresores estocsticos el mtodo de estimacin y las propiedades de los estimadores a e o dependen de la relacin entre u y X. Estudiaremos las propiedades del estimador MCO en las o 172
Anlisis de datos a siguientes situaciones: 1. Independencia entre regresor y error. 2. Incorrelacin contempornea entre regresor y error. o a 3. Correlacin entre regresor y error. o
SARRIKO-ON 04/10
4.2.1.
Independencia entre regresor y error

donde:
Sea Y = X + u
- X es una matriz estocstica, (alguno de sus regresores es una v.a.) con una determinada a funcin de densidad f (X), es decir, X toma diferentes valores con diferentes probabilidades. o
2 - u N (0, u IT )
- X y u se distribuyen independientemente, es decir, E(X u) = E(X )E(u) = 0. Vamos a buscar las propiedades del estimador MCO cuando X y u son independientes. Propiedades en muestras nitas para valores de X no condicionados: Linealidad: M CO = + (X X)1 X u funcin no lineal de X y u. o M CO ya no es una combinacin lineal de las perturbaciones, sino que es una El estimador o funcin estocstica no lineal de X y u, por lo que, sus propiedades dependen de la distribucin o a o conjunta de stas. e Insesgadez: Dado que X y u son independientes y E(u) = 0 por hiptesis bsica, tenemos: o a E(M CO ) = + E[(X X)1 X u] = + E[(X X)1 X ]E[u] = por tanto, M CO es insesgado si X y u son independientes y E[(X X)1 X ] existe y es nito2 . Matriz de varianzas y covarianzas: V (M CO ) = E(M CO )(M CO ) = E[ (X X)1 X uu X(X X)1 ] = = EX {Eu|X [ (X X)1 X uu X(X X)1 ]} = = EX {(X X)1 X Eu|X (uu ) X(X X)1 } = 2 = EX {(X X)1 X u IT X(X X)1 } = 2 E {(X X)1 } = u X
Luego si EX {(X X)1 } , M CO sigue siendo el estimador insesgado de m nima varianza3 .

Para demostrar esta propiedad hemos utilizado los siguientes resultados estad sticos: E(a) = Eb [Ea|b ] y EW X = EX [EW |X ] ya que E(M CO ) = EX [E(M CO |X)] = EX [ + (X X)1 X E(u|X)] = . 3 Siendo:
2
173
SARRIKO-ON 04/10
Anlisis de datos a
2 Un estimador insesgado de V (M CO ) donde u y EX (X X)1 son los dos elementos desconocidos es: V (M CO ) = 2 (X X)1 u
Distribucin e inferencia en muestras nitas: o El estimador M CO es una combinacin no lineal de X y u y por tanto, no tiene porqu tener o e una distribucin normal, incluso aunque X e u la tengan. Como consecuencia no tenemos o garantizado que M CO siga una distribucin normal y por tanto, los estad o sticos t y F no tienen una distribucin exacta conocida por ello, la inferencia para tamaos de muestra pequeos no o n n es vlida. a Conclusin: La eliminacin del supuesto de que X es no estocstica sustituyndolo por X o o a e estocstica, pero independiente de u no altera las propiedades deseables ni la variabilidad de a la estimacin m o nimo cuadrtica. a Propiedades en muestras grandes: 1 Bajo los supuestos habituales, y si adems, se satisface que plim T X X = Q nita y no singular a el estimador de MCO es consistente y es posible derivar sus propiedades asintticas utilizando el o Teorema de Mann y Wald y el Teorema de Cramer. Las condiciones del Teorema de Mann y Wald son: i) u1 , u2 , . . . , uT ii) E(X u) = 0 ii) plim
1 TX 2 v. a tal que ut iid(0, u )
X =Q
nita, simtrica y no singular e
Vericamos que se cumplen. La condicin iii) se cumple siempre, i) se cumple en este contexto ya o que estamos suponiendo perturbaciones esfricas y ii) tambin se cumple ya X y u son indepene e dientes luego E(X u) = E(X )E(u) = 0. Dado que se cumplen i) + ii) + iii) el Teorema de Mann y Wald produce dos resultados: a) plim b)
1 T 1 TX
u =0
d
2 X u N (0, u Q)
El primer resultado nos garantiza la consistencia del estimador MCO y el segundo nos sirve para encontrar su distribucin asinttica. Por lo tanto: o o
EX el valor esperado de la distribucin marginal de X. o Eu|X el valor esperado de la distribucin condicional de u dado X. o EX (X X)1 la matriz de covarianzas poblacional de los regresores calculada en la distribucin marginal de X. o
174
Anlisis de datos a Consistencia: M CO es un estimador consistente del parmetro . a plim M CO = plim + plim 1 XX T
1
SARRIKO-ON 04/10
plim
1 Xu T
= + Q1 0 =
Distribucin asinttica: o o Dado que p p plim M CO = = M CO = (M CO ) 0 el estimador tiene una distribucin degenerada en el l o mite, por lo que, buscamos la distribucin o M CO ) tal que asinttica para T ( o T (M CO ) = 1 XX T
1
1 Xu T
Utilizando el Teorema de Mann y Wald y el Teorema de Cramer obtenemos4 : T (M CO ) = de donde 1 XX T

1
1 Xu T
2 N (0, u Q1 )
d 2 T (M CO ) N (0, u Q1 )
Inferencia asinttica: Dado que se cumple el Teorema de Mann y Wald las propiedades o asintticas se mantienen y tiene sentido la inferencia asinttica. Bajo H0 : R = r, los eso o tad sticos t y F se distribuyen asintticamente como N (0, 1) y 2 respectivamente, si el tamao o n q de la muestra es sucientemente grande. Por lo tanto, podemos utilizar estas distribuciones asintticas para aproximar la distribucin exacta de los estad o o sticos. As para contrastar q , restricciones lineales de la forma: H0 : R = r Ha : R = r utilizamos el siguiente estad stico con distribucin asinttica: o o
d,H0 (R r) [R V () R ]1 (R r) 2 q
luego
d,H0 (RM CO r) [R u (X X)1 R ]1 (RM CO r) 2 2 q
Si el estad stico calculado es menor que el valor en tablas de 2 no rechazamos la H0 para q| un nivel de signicacin . o Si q=1 podemos utilizar el siguiente estad stico y distribucin asinttica asociada: o o RM CO r R u (X X)1 R 2
d,H0
N (0, 1)
en cuyo caso no rechazamos H0 si el valor muestral del estad stico es menor que N (0, 1)| 2 para un nivel de signicatividad .
4 a a
El Teorema de Cramer dice: Si YT = AT ZT , plimAT = A y ZT N (,

X u T
) entonces AT ZT N (A , A
A ).
Del Teorema de Mann y Wald hacemos uso del resultado
N (0, 2 Q).
175
SARRIKO-ON 04/10
Anlisis de datos a
Ejemplo 4.4 Por ejemplo si queremos contrastar la signicatividad de una de las variables explicativas del modelo contrastamos: H0 : i = 0 versus Ha : i = 0. En este caso q=1 y podemos escribir el siguiente estad stico a utilizar junto con su distribucin asinttica, o o i,M CO d,H0 N (0, 1) i,M CO ) des( Donde des(i,M CO ) es la ra cuadrada del elemento i-simo de la matriz 2 (X X)1 . Si el valor z e muestral del estad stico es menor que N (0, 1)| no rechazamos la H0 para un nivel de signicacin o 2 . Ejercicio 4.1 En el modelo lineal simple: Yt = 1 + 2 Xt + ut
2 ut iid(0, u )
t = 1, 2, . . . , T
donde Xt es una variable estocstica, pero independiente de la perturbacin obtener el estimador a o de MCO y sus propiedades en muestras nitas.
4.2.2.
Incorrelacin contempornea entre regresores y error o a
2 Sea Y = X + u con u N (0, u I), X estocstica tal que X y u no son independientes, pero son a incorreladas contemporneamente, es decir, mantenemos que E(Xit ut ) = 0 i = 1, 2, . . . , K, pero a no la independencia entre Xit y ut .
En este caso no podemos derivar anal ticamente las propiedades en muestras nitas del estimador, pero se sigue cumpliendo el Teorema de Mann y Wald y por tanto, podemos mantener las propiedades asintticas. o M CO = + (X X)1 X u es una funcin no lineal de X y u, ambas estocsticas. o a
En general es un estimador sesgado, E(M CO ) = + E[(X X)1 X u] y E[(X X)1 X u] puede ser distinto de cero ya que X y u no son independientes. El clculo anal a tico de su matriz de varianzas y covarianzas es complicado dada la no linealidad del estimador en X y u. Tambin lo es el clculo anal e a tico de E(M CO ). Dado que el estimador es no lineal no conocemos su distribucin exacta, no sigue una distribuo cin normal an en el caso de que Xit i t y u la sigan. Como consecuencia los estad o u sticos t y F no tienen distribucin exacta conocida. o Las propiedades asintticas de consistencia y distribucin asinttica se mantienen ya que o o o podemos aplicar el Teorema de Mann y Wald porque se satisfacen las condiciones de este 1 2 teorema, u (0, u I) y E(X u) = 0, junto con plim( T X X) = Q.
176
Anlisis de datos a Ejercicio 4.2 En el modelo: Yt = Xt + ut t = 1, 2, . . . , T

2 ut N (0, u )
SARRIKO-ON 04/10
donde Xt es una v.a. no independiente de ut , pero tal que E(Xt ut ) = 0. Demostrar las propiedades en muestras nitas y asintticas del estimador MCO del coeciente . o
4.2.3.
Correlacin entre regresores y error o
En ocasiones la hiptesis E(Xit , ut ) = 0 i, t no es vlida. En este caso los estimadores MCO no o a son ni siquiera consistentes. Hay cuatro puntos a solucionar en relacin a este tema: o 1. Cmo aparecen las correlaciones entre X y u? Por ejemplo en las siguientes situaciones: o a) Cuando la variable explicativa est medida con error. a b) Si el modelo tiene un problema de omisin de variable relevante y la variable omitida o est correlada con los regresores. Esta correlacin aparecer v la perturbacin ya que a o a a o la perturbacin recoge las variables omitidas. o c) En modelos de ecuaciones simultneas, por ejemplo en el modelo de oferta y demanda a donde P y Q se determinan simultneamente. a d ) En modelos con variable endgena retardada como regresor y perturbacin autocorrelada. o o 2. Qu importancia puede tener este problema? En realidad depende del caso concreto, pero e de forma general podemos decir que el estimador de MCO pierde las propiedades en muestras pequeas y grandes. n 3. Cmo podemos detectar que existe el problema? Usando test de contraste que sean capaces o de detectar la correlacin entre X y u. Por ejemplo, el contraste de Hausman est diseado o a n para ello. 4. Cmo podemos solucionar el problema? Si la existencia de correlacin entre regresores y pero o turbacin se debe a un problema de omisin de variable relevante debemos intentar especicar o o correctamente el modelo. En el resto de casos tendremos que buscar un mtodo de estimacin e o alternativo a MCO que tenga buenas propiedades, aunque stas se logren slo en muestras e o grandes. Es claro que este es el caso relevante de los tres descritos. Comenzaremos viendo algunos ejemplos en los que X y u estn correlados. a Ejemplo 4.5 Variable exgena medida con error. o Vamos a profundizar en el Ejemplo 5.1 donde analizbamos la productividad de un trabajador, Y , a utilizando como variable explicativa su habilidad, X. Sea el modelo de regresin en trminos de la o e variable no observable Xt productividad: Yt = 1 + 2 Xt + ut t = 1, 2, . . . , T 177
2 ut iid(0, u )
SARRIKO-ON 04/10
Anlisis de datos a
donde la variable Xt es una variable no estocstica y no observable, ya que no se puede cuanticar. a Sin embargo, disponemos de Xt los aos de antigedad en la empresa, variable observable, y vamos n u a utilizarla para aproximar a Xt . Denimos Xt = Xt + vt , tal que Xt es una variable observable, pero aleatoria ya que incorpora el efecto de vt , y lo es, an en el caso de que Xt sea no estocstica u a o ja. Adems, hacemos las siguientes hiptesis: a o
2 vt iid(0, v )
Cov(ut , vt ) = Cov(ut , vs ) = Cov(us , vt ) = 0
En esta situacin el modelo que efectivamente se estima es el siguiente: o Yt = 1 + 2 Xt + ut Propiedades de la nueva perturbacin ut : o E(ut ) = E(ut 2 vt ) = E(ut ) 2 E(vt ) = 0 V ar(ut ) = E(ut E(ut ))2 = E(ut )2 = E(ut 2 vt )2 2 2 2 2 2 = E(ut 2 ) + 2 E(vt ) 22 E(ut vt ) = u + 2 v 22 0 2 + 2 2 luego homocedstica = u a 2 v Cov(ut , us ) = E[(ut E(ut ))(us E(us ))] = E(ut 2 vt , us 2 vs ) = 2 = E(ut us ) 2 E(vt us ) 2 E(ut vs ) + 2 E(vt vs ) = 0, no autocorrelada Adems, necesitamos conocer la relacin entre el regresor y el error, es decir, entre Xt y ut : a o Cov(Xt , ut ) = E(Xt ut ) = E((Xt + vt )(ut 2 vt )) = 2 2 = E(Xt ut ) + E(vt ut ) 2 E(Xt vt ) 2 E(vt ) = 2 v ya que al ser Xt una variable no estocstica E(Xt ut ) = E(Xt vt ) = 0. Al ser la covarianza a entre Xt y ut distinta de cero existe correlacin contempornea entre la variable exgena y la o a o perturbacin. Vemos que la correlacin depende de la varianza del error de medida, cuanto o o peor es la proxy o variable que utilizamos para aproximar la variable no observable, mayor es en trminos absolutos la correlacin. El signo depende del signo del coeciente 2 . El estimador e o MCO de 2 no es consistente, adems la diferencia entre plim y depende directamente de a esta correlacin. o Conclusin: un error de medida en la variable exgena tal que E(Xt ut ) = 0 implica que los estio o 5 . El Teorema de Mann y Wald no se satisface. Los madores MCO son sesgados e inconsistentes coecientes del modelo deber ser estimados por un mtodo de estimacin que produzca estian e o madores consistentes. Para conseguirlo propondremos el Mtodo de Variables Instrumentales. Lo e veremos en la seccin siguiente. o con ut = ut 2 vt
En el Anexo 4.2. Errores de medida en las variables, se han desarrollado con detalle las consecuencias en los estimadores MCO de los coecientes de un modelo, de que el error de medida se produzca en la variable endgena y o simultneamente, en la variable endgena y en la exgena. a o o
178
Anlisis de datos a Ejemplo 4.6 Omisin de variable relevante. o Sea el modelo correctamente especicado: Yt = 1 + 2 X2t + 3 X3t + vt t = 1, 2, . . . , T
SARRIKO-ON 04/10
2 donde vt iid(0, v ), y suponemos E(X2t vt ) = 0 y E(X3t vt ) = 0. Pero el modelo que se estima es el siguiente: Yt = 1 + 2 X2t + ut t = 1, 2, . . . , T
tal que ut = 3 X3t + vt y donde: E(X2t ut ) = E[X2t (3 X3t + vt )] = 3 E(X2t X3t ) + E(X2t vt ) = 3 E(X2t X3t ) E(ut ) = 3 E(X3t ) + E(vt ) = 3 E(X3t ) dado que X3t es una variable relevante, 3 = 0 luego: E(X2t ut ) = 0 si E(ut ) = 0 si E(X2t X3t ) = 0 E(X3t ) = 0
Por tanto, X y u son independientes y E(u|X) = E(u) = 0 si y solo si X2t y X3t son variables aleatorias independientes y E(X3t ) = 0 t. En el resto de los posibles supuestos no lo son. Por tanto, en el caso contemplado, donde se omite la variable X3t correlada con X2t , en el modelo especicado a estimar E(X2t ut ) = 0 y el estimador MCO es inconsistente. Por ejemplo, supongamos que estamos estudiando la funcin de salarios y que proponemos como o variable explicativa el nivel de educacin del individuo medido en aos de educacin: o n o W AGEi = 1 + 2 EDU Ci + ui Si este es nuestro modelo a estimar es claro que estamos omitiendo factores que determinan el salario aparte del nivel educativo como la experiencia, la habilidad, la motivacin. Podemos esperar o que los individuos ms motivados y/o con ms talento tengan a su vez mayor formacin medida en a a o ms aos de educacin y por lo tanto, ser lgico pensar que E(EDU Ci ui ) = 0, luego el estimador a n o a o MCO de 1 y 2 ser sesgado e inconsistente. a En trminos de la especicacin del modelo es importante remarcar que el modelo debe estar e o correctamente especicado antes de proponer un mtodo de estimacin alternativo a MCO. En e o el ejemplo que nos ocupa medir la experiencia es sencillo, pero variables como la habilidad o la motivacin no son sencillas de medir. En general y en el mejor de los casos seremos capaces de o aproximar dichas variables con un error de medida, que como ya se ha apuntado anteriormente, y se desarrollar en esta seccin, conllevan problemas de correlacin entre regresor y perturbacin y a o o o por tanto, la inconsistencia del estimador de MCO. Ejemplo 4.7 Simultaneidad. Sea el modelo formado por las siguientes dos ecuaciones: Yt = 1 + 2 Xt + ut Xt = 1 + 2 Yt + vt 179 t = 1, 2, . . . , T t = 1, 2, . . . , T (4.1) (4.2)
SARRIKO-ON 04/10 tal que: ut vt N 0 0 ,
Anlisis de datos a
2 u uv 2 uv v
Es decir, ut y vt son v.a. normales. Estamos interesados en estimar 1 y 2 en (4.2), para ello queremos saber si X y u son independientes y/o incorreladas. Dado que E(ut ) = 0 t: E(Xt ut ) = E[(1 + 2 (1 + 2 Xt + ut ) + vt )ut ] = = 1 E(ut ) + 2 1 E(ut ) + 2 2 E(Xt ut ) + 2 E(u2 ) + E(vt ut ) = t 2 = 2 2 E(Xt ut ) + 2 u + uv 1 2 (uv + 2 u ) 1 2 2 con lo que, E(Xt ut ) = 0 si 2 = 0 y/o uv = 0. En este ejemplo el estimador MCO es inconsistente. Adems, el Teorema de Mann y Wald no se satisface. Deber a amos buscar un estimador alternativo a MCO y que s fuese consistente. E(Xt ut ) = Ejemplo 4.8 Variable endgena retardada como regresor y perturbacin autocorrelada. o o resolviendo:
Supongamos un modelo con dinmica en la parte sistemtica porque incluye como regresor a la a a variable endgena retardada y con dinmica en la perturbacin ya que esta sigue un proceso autoo a o rregresivo de primer orden. Yt = 1 + 2 Yt1 + 3 Xt + ut ut = ut1 +
t t
iid(0, 2 )
En este caso E(Yt1 ut ) = 0 luego E(X u) = 0 y el estimador MCO no es consistente. Este caso se analizar en profundidad en el tema siguiente, Modelos Dinmicos. a a En los ejemplos anteriores el estimador MCO es inconsistente ya que la matriz de regresores est correlada con la perturbacin. Un estimador alternativo y consistente es el estimador de Vaa o riables Instrumentales.
4.3.
Estimador de Variables Instrumentales
En modelos donde existe correlacin entre regresores y error el estimador MCO es inconsistente y o sesgado ya que E(X u) = 0. El procedimiento para obtener estimadores consistentes en un modelo de este tipo es el Mtodo de Variables Instrumentales, VI. El mtodo de Variables Instrumentales e e se basa en encontrar un conjunto de K variables, Z1t , Z2t , . . . , ZKt , que se llaman instrumentos o variables instrumentales tales que, satisfacen las siguientes condiciones: 1. Cada uno de los instrumentos est incorrelacionado con el trmino de error de la ecuacin de a e o inters, E(Zjt ut ) = 0 t, j, j = 1, 2, . . . , K. e 2. Los instrumentos estn correlacionados con la variable para la cual hacen de instrumento, a E(Zjt Xit ) = 0. En cuanto a esta correlacin, debe existir, pero no puede ser muy importante o pues en este caso, si lo fuera, E(Zjt ut ) = 0 y Zjt no servir de instrumento. a 180
Anlisis de datos a Junto con las dos anteriores deben de cumplirse dos condiciones ms: a 3. (Z X) es una matriz no singular, es decir, es invertible.
1 4. plim( T Z Z) = QZZ matriz nita.
SARRIKO-ON 04/10
El estimador de variables instrumentales, dada una matriz de instrumentos Z se dene6 : V I = (Z X)1 Z Y Una forma intuitiva de pensar en cmo obtener este estimador podemos encontrarla a partir de o las ecuaciones normales del estimador de MCO. Cualquiera de los modelos anteriores podemos escribirlos de la forma matricial habitual Y = X + u . Premultiplicando el modelo por X tenemos: X Y = X X + X u Si E(X u) = 0 entonces E(X Y ) = E(X X) + 0 luego E(X Y ) E(X X) = 0 que ser la a expresin de las ecuaciones normales en trminos poblacionales. En trminos muestrales podemos o e e = 0 luego X (Y X ) = 0 y X u = 0. escribir X Y X X
1 Si plim T X u = 0 los estimadores as obtenidos son consistentes. Por tanto, parece que sugiere que 1 cuando plim T X u = 0 en vez de premultiplicar por X lo hagamos por una matriz Z que satisface 1 plim T Z u = 0 tal que, podemos denir el estimador consistente V I = (Z X)1 Z Y dada la matriz Z que cumple E(Z u) = 0. Llamamos a Z matriz de instrumentos. De las condiciones citadas anteriormente notar que las condiciones 1 y 2 garantizan la consistencia del estimador, mientras que las condiciones 3 y 4 garantizan que el estimador V I denido como V I = (Z X)1 Z Y se pueda evaluar en la muestra.
En general en la matriz de regresores X slo habr unas variables que no satisfagan la condicin o a o E(Xit ut ) = 0 y son estas variables las que necesitan de variables instrumentales. Para el resto de variables, las no correladas con la perturbacin, el mejor instrumento es la propia variable. Es o decir, las matrices Z y X tendrn en comn aquellas columnas correspondientes a las variables a u incorrelacionadas con el trmino de error. Notar que necesariamente Z y X deben tener el mismo e nmero de columnas ya que en otro caso (Z X) no ser cuadrada. u a Antes de ver ejemplos de cmo buscar los instrumentos vamos a ver las propiedades del estimador. o
4.3.1.
Propiedades del estimador de Variables Instrumentales
Linealidad: Dado que X es una matriz estocstica el estimador de VI no es lineal en u, a V I = + (Z X)1 (Z u) En la expresin del estimador aparecen X y u ambas variables aleatorias, por tanto, V I es o una funcin no lineal de X y u. o
6
En el Anexo 4.3. Estimador de Variables Instrumentales, aparece derivado formalmente este estimador de VI.
181
SARRIKO-ON 04/10
Anlisis de datos a
Insesgadez: En general el estimador ser sesgado ya que E[(Z X)1 (Z u)] = 0. En la exa presin E[(Z X)1 (Z u)] hemos de notar dos cosas. Por un lado, el requisito impuesto para o 1 obtener el estimador de Variables Instrumentales, V I , es plim T Z u = 0 y no la independencia entre Z y u. Por otro lado, aunque Z y u fuesen independientes la expresin anterior o 1 (Z u)] = 0 y participa de X, matriz estocstica no independiente de u. Luego E[(Z X) a E(V I ) = + E[(Z X)1 (Z u)] = Por tanto, en muestras nitas el estimador de Variables Instrumentales es un estimador no lineal y en general sesgado. Su distribucin exacta es desconocida. En muestras grandes el o estimador es consistente y tiene distribucin asinttica conocida. o o Consistencia del estimador de Variables Instrumentales y Distribucin asinttica: o o Vamos a demostrar la consistencia del estimador y a buscar su distribucin asinttica utilio o zando el Teorema de Mann y Wald aplicado a Z y u. Sea X matriz de variables explicativas de orden (T K) y Z una matriz de instrumentos de orden (T K). Si se cumplen las siguientes condiciones:
2 i) u (0, u I).
ii) E(Z u) = 0 iii) plim iv) plim

1 TZ 1 TZ
Z = QZZ X = QZX
nita, simtrica y denida positiva. e nita, no singular
entonces se tiene por el Teorema de Mann y Wald los siguientes resultados: a) plim b)
1 T 1 TZ
u =0
d
2 Z u N (0, u QZZ )
Utilizando el resultado a) podemos demostrar la consistencia del estimador V I : plim V I = + plim 1 ZX T

1
plim
1 Zu T
= + Q1 0 = ZX
El estimador de Variables Instrumentales es consistente y la condicin importante es la auseno cia de correlacin entre los instrumentos y el trmino de error del modelo de inters. o e e Utilizando el resultado b) junto con el Teorema de Cramer obtenemos su distribucin asinttio o 7: ca T (V I ) = 1 ZX T
1
1 Zu T
2 N 0 , u Q1 QZZ (Q1 ) ZX ZX
7 Este resultado puede generalizarse al caso en el que la perturbacin tiene autocorrelacin, pero en ese caso la o o matriz de varianzas y covarianzas del estimador VI no es la derivada anteriormente.
182
Anlisis de datos a
SARRIKO-ON 04/10
El resultado anterior justica que en muestras grandes se utilice como matriz de covarianzas asinttio ca del estimador de variables instrumentales a: 2 V (V I ) = Tu ZX T
1
ZZ T
ZX T
= V I (Z X)1 Z Z ((Z X)1 ) 2 donde se utilizan las matrices de momentos muestrales ZTX y respectivos QZX y QZZ y (Y X V I ) (Y X V I ) V I = 2 T K
Z Z T
para aproximar sus l mites
2 es un estimador consistente de u . Notar que el denominador de V I es T K, pero podr 2 amos haber considerado T dado que el estimador es asinttico y por lo tanto, invariante a que el denominador o sea T T K. o
4.3.2.
Cmo buscar los instrumentos o
Con respecto a los instrumentos sabemos que stos tienen que cumplir las siguientes condiciones: e 1. Estar incorrelacionados con la perturbacin del modelo de inters, E(Zjt ut ) = 0. o e 2. Estar correlacionados con la variable para la cul hacen de instrumento, E(Zjt Xit ) = 0. a Adems, la matriz (Z X) debe ser una matriz no singular con rg(Z) = K < T , es decir, (Z X)1 . a En la prctica existen dos situaciones diferentes en la bsqueda de instrumentos: a u 1. Que el nmero de instrumentos disponibles coincida con el nmero de variables que necesiten u u instrumento. 2. Que el nmero de instrumentos disponibles sea mayor que el nmero de variables que necesiten u u instrumento. Nmero de instrumentos disponibles igual al nmero de variables explicativas que lo necesitan u u Supongamos que el nmero de instrumentos de que se dispone es igual al nmero de variables u u explicativas que necesitan instrumento. En este caso cada instrumento constituye una variable instrumental para su correspondiente variable explicativa correlada con la perturbacin. Para el o resto de variables, para las que no necesitan instrumento, su mejor instrumento es ella misma. Los instrumentos deben cumplir los requisitos mencionados anteriormente, no deben estar correlados con la perturbacin del modelo de inters y deben de estar correlados con la variable explicativa para o e la que actan de instrumento. Adems, debe existir (Z X)1 . A continuacin veremos un ejemplo u a o terico que nos servir para mostrar el desarrollo matricial. o a
183
SARRIKO-ON 04/10 Ejemplo 4.9 Sea el modelo: Yt = 1 + 2 Xt + ut tal que

2 ut iid(0, u ) t = 1, 2, . . . , T
Anlisis de datos a
2 Xt = 0, 7Xt1 + vt vt iid(0, v ) E(ut vs ) = 5 si t = s E(ut vs ) = 0 si t = s
En este ejercicio la matriz X = [1 Xt ] es estocstica ya que el regresor Xt es un regresor estocstia a 8 . La constante no crea problemas de correlacin con u ya que es un regresor no estocstico, co o a t E(1 ut ) = E(ut ) = 0. Sin embargo, el regresor estocstico Xt est correlado contemporneamente a a a con la perturbacin: o E(Xt ut ) = E[(0, 7Xt1 + vt ) ut ] = 0, 7E(Xt1 ut ) + E(vt ut ) = 0, 7 0 + 5 = 5 Luego E(X u) = 0 y el estimador MCO ser no lineal y sesgado. En muestras grandes adems, a a ser inconsistente. Deber a amos estimar los coecientes 1 y 2 por el Mtodo de Variables Instrumene tales. Para ello buscamos un instrumento para Xt , el unico regresor correlado con la perturbacin. o Podemos pensar en Zt = Xt1 dado que Xt1 est incorrelado con la perturbacin, E(Xt1 ut ) = 0 a o y correlado con Xt ya que sta se genera por un proceso autorregresivo, E(Xt Xtj ) = 0 j > 0. e Adems, con Zt = Xt1 rg(Z) = 2 = K, luego (Z X)1 . a Aplicamos para Zt = Xt1 el estimador de Variables Instrumentales9 : Y
((T 1)1)
Y2 Y3 . . . YT
X
((T 1)2)
1 X2 1 X3 . . . . . . 1 XT
Z
((T 1)2)
1 1 . . .
X1 X3 . . .
1 XT 1
El estimador V I = (Z X)1 (Z Y ) es el siguiente10 : 1 2

8
=
VI
(T 1) T 2 Xt1
T 2 T 2
Xt Xt Xt1
T 2 T 2
Yt Xt1 Yt
En adelante la notacin utilizada X = [1 o
Xt ] hace referencia a la siguiente matriz: 1 X1 1 X2 X = [1 Xt ] = . . . . . . 1 XT
Notar en el orden de las matrices que para Zt = Xt1 perdemos una observacin al denir el instrumento. Si el o instrumento hubiera sido Zt = Xt2 perder amos dos observaciones y en ese caso las matrices Y, X y Z ser an: Y3 1 X3 1 X1 1 X4 1 Y4 X2 = . = . = . X Z Y . . . . . . . . . . . . ((T 2)2) ((T 2)2) ((T 2)1) YT
10
XT
XT 2
A la hora de trabajar con el estimador de VI es importante notar que la matriz a invertir, (Z X), no es simtrica. e
184
Anlisis de datos a Su matriz de varianzas y covarianzas estimada se dene: V (V I ) = V I (Z X)1 (Z Z)((Z X)1 ) = 2 V I 2 siendo: V I = 2 (T 1) T 2 Xt1
T 2 T 2
SARRIKO-ON 04/10
Xt Xt Xt1
(T 1) T 2 Xt1
T 2 T 2
Xt1 2 Xt1
(T 1) T 2 Xt1
T 2 T 2
Xt Xt Xt1
(Y X V I ) (Y X V I ) T K
o Ejemplo 4.10 En este ejemplo vamos a volver sobre la estimacin de un modelo con variable exgena medida con error y nos va a permitir ilustrar cmo buscar instrumentos de manera adeo o cuada:
2 Supongamos que queremos estimar el modelo Yt = Xt + ut ut iid(0, u ) siendo Xt una variable no estocstica e inobservable. Sin embargo, se dispone de la variable observable Xt = Xt + t a que nos va a permitir aproximar a la variable inobservable. Adems, en cuanto al error de medida, a 2 ) y Cov(u , ) = Cov(u , ) = Cov(u , ) = 0. El modelo considerado se sabe que t iid(0, t t t s s t para estimar en trminos de la variable observable Xt es: e
Yt = Xt + ut
t = 1, . . . , T
donde ut = (ut t ) y tal que E(Xt ut ) = 2 = 0. El estimador de MCO es inconsistente. El estimador consistente de lo podemos obtener utilizando el estimador de VI, V I = (Z X)1 Z Y tal que: Y = Y1 Y2 . . . YT ; X= X1 X2 . . . XT Zt Y t Z t Xt ; Z= Z1 Z2 . . . ZT ;
V I = (Z X)1 Z Y =
Es fundamental en el estimador de VI la eleccin del instrumento y ha de cumplir las condiciones o explicitadas anteriormente. Vamos a proponer algunos posibles instrumentos y ver sus posibilidades como instrumentos adecuados: Supongamos que Zt = 1 t . En este caso E(Zt ut ) = 1E(ut ) = 0 y E(Zt Xt ) = E(Xt ) = E(Xt + t ) = E(Xt ). Notar que Xt no tiene que estar en desviaciones a la media ya que en ese caso Xt = 0 y V I no est denido. a Otro posible instrumento ser Zt = t, luego la variable instrumental es una tendencia detera minista y por lo tanto, variable no estocstica incorrelada con la perturbacin ut , E(Zt ut ) = a o 185
SARRIKO-ON 04/10
Anlisis de datos a
Zt E(ut ) = tE(ut ) = 0. Ahora bien, Zt = t tiene que estar correlacionada con Xt tal que Zt Xt = 0. Por lo tanto, Xt tiene que presentar cierta tendencia en el tiempo. Por ejemplo, en el grco de la izquierda de la Figura 4.1 la serie no muestra tendencia temporal luego a el instrumento Zt = t no ser adecuado. Sin embargo, en el grco de la derecha la serie a a dibujada si muestra tendencia temporal, en este caso creciente, con lo cual el instrumento Zt = t tiene sentido. Figura 4.1: Serie sin tendencia versus serie con tendencia
6.8 6.6 60 6.4 6.2 6 40 5.8 5.6 5.4 5.2 10 5 4.8 1980 1981 1982 1983 1984 1985 0 1986 1988 1990 1992 1994 1996 1998 2000 X_t 30 20 Xt 50 70
En el caso de Zt = t la matriz Z es:
Z=
1 2 . . . T
Otra variable instrumental puede ser otra variable medida con error, y distinta de Xt , que 2 aproxime a Xt , por ejemplo, Zt = Xt + t , tal que t iid(0, ) y E(t ut ) = 0. Adems, a los errores de medida tienen que estar incorrelados, E( t t ) = 0, entonces, E(Zt ut ) = E((Xt + t )(ut t )) = Xt E(ut ) + E(t ut ) Xt E( t ) E(t t ) = 0 En este caso la unica dicultad es encontrar la proxy alternativa. Una posibilidad es que dos instituciones independientes midan la misma variable de forma que los errores de medida se mantengan independientes. Actuando como en el ejercicio anterior podemos pensar en Zt = Xt1 . En este caso si o a E( t us ) = 0, E(Xt1 ut ) = 0 ya que no existe correlacin no contempornea: E(Xt1 ut ) = E((Xt1 + t1 )ut ) = E((Xt1 + t1 )(ut t )) = = E(Xt1 ut ) + E( t1 ut ) E(Xt1 t ) E( t t1 ) = 0
y adems, E(Xt1 Xt ) = 0. Por tanto, tambin es un instrumento adecuado. a e Si generalizamos el modelo para incluir un trmino constante: e Yt = + Xt + ut 186 t = 1, 2, . . . , T
Anlisis de datos a entonces: X = (T 2) 1 X1 1 X2 . . . . . . 1 XT Z

(T 2)
SARRIKO-ON 04/10
Z11 Z12 . . . Z1T
Z21 Z22 . . . Z2T
Al menos necesitamos dos instrumentos. Para la constante 1 podemos usar Z1t = 1 t ya que E(Z1t ut ) = 1E(ut ) = 0, es decir, el mejor instrumento es la misma variable. Para Xt hemos de buscar un instrumento Z2t distinto de la constante 1 ya que si repetimos el instrumento rg(Z) = 1 < 2 y (Z X)1 , con lo que el estimador V I = (Z X)1 Z Y no se puede obtener. No est denido. Adems, tampoco sirven otras constantes como Z2t = 5 por el a a mismo problema.
Ejemplo 4.11
Queremos estimar la relacin: o Yt = 1 + 2 X2t + 3 X3t + ut

2 ut iid(0, u )
t = 1, 2, . . . , T
donde X2t es un regresor no estocstico y X3t es una variable no estocstica e inobservable. Pero se a a dispone de una variable observable X3t tal que X3t = X3t + t y
t
iid(0, 2 )
Cov(ut , t ) = Cov(ut , s ) = Cov(us , t ) = 0
luego el modelo a estimar en trminos de las variables observables es: e Yt = 1 + 2 X2t + 3 X3t + ut t = 1, 2, . . . , T
con ut = ut 3 t , E(X2t ut ) = 0 y E(X3t ut ) = 3 2 = 0. En este contexto el estimador de MCO es inconsistente y para obtener consistencia los coecientes 1 , 2 y 3 deber ser estimados por an Variables Instrumentales. Supongamos que disponemos de otra proxy Zt para aproximar a X3t tal que Zt = X3t + t con 2 t iid(0, ), Cov(ut , t ) = Cov(ut , s ) = 0 y E( t t ) = 0, es decir, los dos errores de medida estn incorrelacionados. a Podemos usar esta proxy Zt como instrumento para X3t ya que: E(Zt ut ) = E((X3t + t )(ut 3 t )) = = E(X3t ut ) + E(t ut ) 3 E(X3t t ) 3 E(t t ) = 0 + 0 3 0 3 0 = 0 adems, E(Zt X3t ) = 0 ya que ambas son medidas de la variable X3t no observable. Para la constante a 1 y X2t el mejor instrumento son ellas mismas. En este caso las matrices involucradas en el estimador de Variables Instrumentales son: Y
(T 1)
Y1 Y2 . . . YT
X = (T 3)
1 X21 1 X22 . . . . . . 1 X2T 187
X31 X32 . . . X3T
Z
(T 3)
1 X21 1 X22 . . . . . . 1 X2T
Z1 Z2 . . . ZT
SARRIKO-ON 04/10
Anlisis de datos a
con rg(Z) = 3, luego (Z X)1 y el estimador V I = (Z X)1 (Z Y ) est bien denido. a En este caso no podemos contemplar dos posibilidades para denir el instrumento Zt , este no puede ser ni la constante 1 ni el regresor X2t ya que la matriz no ser de rango completo y (Z X)1 . a
Nmero de instrumentos disponibles mayor al nmero de variables explicativas que lo necesitan. u u Mtodo de M e nimos Cuadrados en dos Etapas Generalmente, se dispondr de un nmero de instrumentos mayor que de variables explicativas a u que lo necesiten, en este caso habr muchas formas de construir las variables instrumentales que a precisamos para obtener un estimador consistente. Pero dado que la matriz de covarianzas del estimador de VI depende de los valores de stas, el modo en que se combinan los instrumentos e para generar variables instrumentales inuye sobre la eciencia del estimador de VI respecto a otro estimador de VI de su misma clase. De ah que en ocasiones se hable de la eciencia relativa de los estimadores de Variables Instrumentales. A continuacin vamos a proponer algunos ejemplos: o Ejemplo 4.12 En el modelo: Yt = 1 + 2 X2t + 3 X3t + 4 X4t + ut donde: t = 1, 2, . . . , T
2 ut iid(0, u ) X3t , X4t no estocsticas a 2 X2t = 0, 5X2,t1 + ut vt iid(0, v ) E(ut vt ) = 5 t = s E(ut vs ) = 0 t = s
En este ejercicio la matriz de regresores X = [ 1 X2t X3t X4t ] es estocstica ya que incluye al a regresor estocstico X2t . Necesitamos ver como es E(X u). Dado que X3t y X4t son no estocsticos a a E(X3t ut ) = 0 y E(X4t ut ) = 0, pero la variable explicativa X2t y la perturbacin estn contemo a porneamente correladas, a E(X2t ut ) = E[(0, 5X2,t1 + vt ) ut ] = 0, 5E(X2,t1 ut ) + E(vt ut ) = 0, 5 0 + 5 = 5 Por tanto, E(X u) = 0 y el estimador MCO ser no lineal y sesgado. En muestras grandes adems, a a ser inconsistente. Deber a amos estimar por el Mtodo de Variables Instrumentales, pero slo la e o variable X2t necesita instrumento, para X3t y X4t el mejor instrumento es la propia variable. En este caso hay varios instrumentos que cumplen los requisitos. Los retardos de los dos regresores no estocsticos X3t y X4t , as como el retardo del regresor estocstico X2t estn incorrelados con la a a a perturbacin: o E(X2,t1 ut ) = 0; E(X3,t1 ut ) = 0; E(X4,t1 ut ) = 0 Adems, las variables X2,t1 , X3,t1 y X4,t1 estn correladas con X2t por la propia relacin del a a o modelo. Por tanto, X2,t1 , X3,t1 y X4,t1 ser buenos instrumentos. Tambin lo ser combian e an naciones lineales de los mismos. La cuestin es que si utilizamos todos los posibles instrumentos, o 188
Anlisis de datos a
SARRIKO-ON 04/10
supongamos que su nmero es por ejemplo l, y los introducimos en Z(T l) , la matriz de instrumentos u tiene ms columnas que X(T K) . En esta situacin en la que hay ms hay ms instrumentos que a o a a los que se necesitan, l > K, la matriz (Z X) no ser cuadrada y no existir su inversa, (Z X)1 , a a con lo que no podemos denir el estimador de VI como V I = (Z X)1 (Z Y ). Dado que en esta situacin el nmero de instrumentos supera al de variables explicativas que lo preo u cisan, se trata de buscar cul de todos los posibles instrumentos minimiza la varianza del estimador a resultante. Una posibilidad consiste en generar la variable instrumental con mayor correlacin con o X2t . Para ello se estima por MCO una regresin auxiliar de esta variable sobre todos los posibles o instrumentos. Para el ejemplo que nos ocupa, si suponemos que los unicos instrumentos de que disponemos son los primeros retardos de los regresores originales la regresin auxiliar ser 11 : o a X2t = 1 + 2 X2,t1 + 3 X3,t1 + 4 X4,t1 + 5 X3t + 6 X4t + t t = 2, 3, . . . , T
as X2t = 1 + 2 X2,t1 + 3 X3,t1 + 4 X4,t1 + 5 X3t + 6 X4t es una combinacin lineal de todos o los posibles instrumentos que se incluyen en la matriz de instrumentos Z, cada uno ponderado por su correlacin con X2t , la variable a instrumentalizar, siendo Z: o 1 X21 X31 X41 X32 X42 1 X23 X32 X42 X33 X43 Z= . . . . . . . . . . . . . . . . . . 1 X2T 1 X3T 1 X4T 1 X3T X4T A continuacin se estima el modelo por VI con: o X = [ 1 X2t X = [ 1 X2t X3t X3t X4t ] X4t ]
Al estimador de VI as obtenido se le llama estimador de M nimos Cuadrados en dos Etapas, 12 : MC2E, y se dene M C2E = (X X)1 X Y donde X= 1 X22 1 X23 . . . . . . 1 X2T X32 X33 . . . X3T X42 X43 . . . X4T X= 1 X22 1 X23 . . . . . . 1 X2T X32 X33 . . . X3T X42 X43 . . . X4T
El estimador de MC2E es un estimador de VI que utiliza todos los instrumentos de forma ptima o en el sentido de que es un estimador consistente y es el ms eciente asintticamente dentro de la a o clase de estimadores de VI que toman solamente un subconjunto de todos los posibles instrumentos.
11 12
Notar que en este ejemplo perdemos una observacin al construir X2t t = 2, 3, . . . , T . o En el Anexo 4.4. Estimador de M nimos Cuadrados en dos Etapas se desarrolla formalmente el estimador.
189
SARRIKO-ON 04/10 Ejemplo 4.13 Sea el modelo: Yt = 1 + 2 Xt + 3 W1t + ut donde Xt = 1 + 2 Yt + 3 W2t + 4 W3t + vt
2 ut N ID(0, u ) 2 vt N ID(0, v )
Anlisis de datos a
t = 1, 2, . . . , T
Cov(ut , vt ) = uv
W1t , W2t y W3t son no estocsticas a Dado que 2 = 0 y/o uv = 0 existe correlacin entre Xt y ut , E(Xt ut ) = 0. El estimador adecuado o para obtener al menos la propiedad de consistencia es el estimador de Variables Instrumentales. Necesitamos buscar un instrumento para la variable Xt . Tenemos dos posibles instrumentos disponibles W2t y W3t . Para combinarlos de forma ptima podemos realizar la siguiente regresin: o o Xt = 0 + 1 W1t + 2 W2t + 3 W3t + t t = 1, 2, . . . , T
As el instrumento adecuado para Xt es Xt obtenido de la estimacin por MCO de la regresin o o anterior tal que: 1 W11 . . . Z= . . . 1 W1T W21 . . . W2T W31 . . . W3T
Utilizamos el instrumento para jar la matriz de instrumentos X. Aplicamos el estimador de Variables Instrumentales para el cul: a X= 1 X1 1 X2 . . . . . . 1 XT W11 W12 . . . W1T X= 1 X1 1 X2 . . . . . . 1 XT W11 W12 . . . W1T Y = Y1 Y2 . . . YT
Sobre el estimador de VI podemos hacer dos observaciones: Hay que notar que en el estimador de MC2E se regresan todas las variables explicativas sobre los posibles instrumentos. Para aquellas variables incorreladas con la perturbacin el mejor o instrumento son ellas mismas. La inclusin de retardos de las variables exgenas como instrumentos aumentar el conjunto o o a de informacin utilizado en la construccin del estimador de MC2E. As hay un estimador de o o , MC2E para cada conjunto de instrumentos que se considere. Al utilizar ms informacin, el a o estimador MC2E resultante ser ms eciente asintticamente relativamente a otro estimador a a o de VI que utilizase un subconjunto de los posibles instrumentos. Sin embargo, el uso de retardos obliga a prescindir de algunas observaciones muestrales, lo que disminuye el nmero de grados u de libertad y puede inuir en la eciencia. 190
Anlisis de datos a
SARRIKO-ON 04/10
4.3.3.
Contraste de hiptesis con el estimador de VI o
Con el estimador de VI podemos utilizar el siguiente estad stico para hacer contrastes de restricciones lineales de la forma: H0 : R = r Ha : R = r (RV I r) [R (V (V I ) R ]1 (RV I r) 2 q donde q es el nmero de restricciones que se contrastan. u Podemos escribir el estad stico anterior como:
d,H0 (RV I r) [ R V I (Z X)1 Z Z ((Z X)1 ) R ]1 (RV I r) 2 2 q d,H0
Las reglas de aceptacin y rechazo son las usuales. No rechazaremos la hiptesis nula si el valor o o muestral del estad stico es menor que el valor cr tico 2 para un valor de signicacin elegido . o q| Ejemplo 4.14 Para contrastar la signicatividad individual de un regresor, H0 : i = 0 versus Ha : i = 0 dado que q = 1 podemos utilizar: i,V I d,H0 N (0, 1) i,V I ) des( Donde des(i,V I ) es la ra cuadrada del elemento i-simo de la matriz 2 (Z X)1 Z Z ((Z X)1 ) . z e Si el valor muestral del estad stico es mayor que N (0, 1)| rechazamos la hiptesis nula para un o 2 nivel de signicatividad .
4.4.
Contraste de Hausman
Necesitamos derivar un test de contraste que sea capaz de juzgar la incorrelacin entre X y u. Este o test es el contraste de Hausman. Sirve para contrastar si los regresores estn o no correlacionados a con la perturbacin. Las hiptesis de contraste son: o o H0 : X y u no estn correlacionadas a Ha : X y u estn correlacionadas a E(X u) = 0 E(X u) = 0
Consideremos el modelo de regresin lineal general en forma matricial: o Y = X + u Y = X1 1 + X2 2 + u

(T K1 ) (T K2 )
u (0, 2 I)
donde K1 variables explicativas en la matriz X no estn correlacionadas con u, E(X1 u) = 0, pero a 13 . El contraste de Hausman considera, en este contexto, se cree que K2 variables pueden estarlo
13 Un caso particular ser que en X1 se incluyera unicamente a la columna de unos y en X2 el resto de variables a explicativas.
191
SARRIKO-ON 04/10 contrastar:
Anlisis de datos a
H0 : E(X2 u) = 0 Ha : E(X2 u) = 0
El estad stico de contraste considera la diferencia de dos estimadores de los coecientes , el estimador de MCO y un estimador de VI tal que: M CO bajo H0 es consistente y eciente asintticamente, pero inconsistente bajo Ha . o V I consistente bajo H0 y Ha , pero menos eciente asintticamente que MCO bajo H0 . o El estad stico de contraste podemos escribirlo como: (2,V I 2,M CO ) [V (2,IV ) V (2,M CO )]1 (2,V I 2,M CO ) 2 p con las reglas de decisin habituales y p = K2 . o Supongamos que queremos contrastar una unica restriccin, H0 : E(Xit , ut ) = 0 versus Ha : o E(Xit ut ) = 0, y p = K2 = 1. En este caso podemos escribir el estad stico de contraste como: (i,V I i,M CO )2 d,H0 2 1 V (i,IV ) V (i,M CO ) Si el estad stico calculado es menor que el valor 2 no rechazamos H0 : E(Xit ut ) = 0 para un 1| nivel de signicatividad y concluir amos que no existe correlacin estad o sticamente signicativa entre el regresor Xit y ut . En este caso si las perturbaciones del modelo son esfricas el estimador e adecuado ser MCO. Este estimador a pesar de ser no lineal y sesgado ser consistente. a a Si el estad stico calculado es mayor que el valor 2 rechazamos H0 : E(Xit ut ) = 0 para un nivel de 1| signicatividad , y concluimos que el regresor Xit y ut estn correlacionados. El estimador MCO a es inconsistente. En este caso si las perturbaciones del modelo son esfricas el estimador adecuado e ser VI, estimador no lineal y sesgado en general, pero consistente y asintticamente eciente si se a o buscan correctamente el instrumento o instrumentos necesarios. Al computar el estad stico de contraste es necesario calcular V (V I ) y V (M CO ), ambas expresiones 2 . Suponiendo bajo H que u (0, 2 I), podemos participan de un estimador consistente de 0 u utilizar: V (V I ) = V I (Z X)1 Z Z ((Z X)1 ) 2 V (M CO ) = M CO (X X)1 2 con: (Y X V I ) (Y X V I ) V I = 2 T K M CO ) (Y X M CO ) (Y X M CO = 2 T K Asintticamente ambos coinciden y el test es asinttico. Sin embargo, se puede demostrar que la o o 2 potencia del contraste aumenta si utilizamos como estimador consistente de u al estimador de VI, V I . Por otro lado, y con respecto al denominador de ambos estimadores, dado que son asintticos 2 o es indiferente que ste sea T K T . e o
d,H0
192
Anlisis de datos a Ejemplo 4.15 pa s:
SARRIKO-ON 04/10 Se propone la siguiente especicacin para la funcin de demanda de vino de un o o Qt = 1 + 2 Pt + ut t = 1, 2, . . . , T
donde ut (0 , 0,0921). Dado que el precio se determina simultneamente con la cantidad Qt , se a sospecha que Pt pueda estar correlacionada con ut . Se dispone de datos de un ndice de costes de almacenamiento, St que se determina exgenamente, por lo que se considera independiente de ut . o Dados los siguientes datos para los aos de 1955-1975: n pt qt = pt st = st qt = (Pt P )(Qt Q) = 1, 78037 (Pt P )(St S) = 0, 500484 (St S)(Qt Q) = 2, 75474 s2 = t p2 = t (St S)2 = 2, 1417 (Pt P )2 = 0, 507434
Se pide proponer un estimador consistente de los coecientes 1 y 2 del modelo. Para proponer un estimador consistente de los coecientes de la relacin es necesario saber si existe o o no correlacin entre Pt y ut . Lo contrastamos: o H0 : E(Pt ut ) = 0 Ha : E(Pt ut ) = 0 con (2,V I 2,M CO )2 d,H0 2 1 V (2,IV ) V (2,M CO )
Calculamos los estimadores MCO y VI utilizando en este ultimo como instrumento para Pt al el ndice de coste de existencias de almacn St : e 2,M CO = 2,V I = 1, 78037 pt qt 2 = 0, 507434 = 3, 5085 pt st qt 2, 75474 = = 5, 4862 st pt 0, 500484
A continuacin calculamos las correspondientes varianzas estimadas utilizando el valor 2 = 0, 09217, o conocido por el enunciado,
2 u 0, 09217 V (2,M CO ) = = = 0, 18164 0, 507434 p2 t 2 V (2,V I ) = u
s2 0, 0921 2, 1417 t = = 0, 78747 2 st pt ) (0, 500484)2
y nalmente, computamos el estad stico: H= (2,V I 2,M CO )2 (5, 4862 3, 5085)2 = = 6, 5721 0, 78747 0, 18164 V (2,V I ) V (2,M CO )
H = 6, 5721 > 3, 841 = 2 o 1|0,05 por tanto, rechazo la hiptesis nula para = 5 % y E(Pt ut ) = 0, Pt y ut no son incorreladas. 193
SARRIKO-ON 04/10
Anlisis de datos a
Este ejercicio recoge un ejemplo prctico de la dicultad de estimar relaciones simultneas. En a a un contexto donde la variable endgena y y el regresor se determinan simultneamente como es o a ste, donde, lo que se especica es la funcin de demanda del vino, la matriz de regresores es e o estocstica, como ya se apunt en el Ejemplo 5.2. Es una de las situaciones en que existe correlacin a o o muestral signicativa entre regresor y perturbacin, como se ha detectado utilizando el estad o stico de Hausman. El estimador MCO es inconsistente, los coecientes del modelo deben ser estimados por VI, estimador consistente y asintticamente eciente. Adems, existe un unico instrumento, St o a y una unica variable que lo necesita, Pt . La FRM podemos escribirla: Qt = 1,V I + 5, 4862 Pt Por otra parte, el estimador de VI bajo perturbaciones esfricas permite hacer inferencia asinttica e o vlida. Como podemos comprobar, la variable precio es signicativa individualmente. Para ello a contrastamos H0 : 2 = 0 versus Ha : 2 = 0 con el estad stico y distribucin asinttica: o o 2,V I d,H0 N (0, 1) des(2,V I ) Dado que el valor muestral del estad stico es t = 5,4862 = 6, 1823 > 1, 96 = N (0, 1)|0,025 re0,78747 chazamos H0 para un nivel de signicatividad del 5 % y el precio es una variable individualmente signicativa.
A continuacin vamos a ver un ejemplo, utilizando el programa gretl, de cmo trabajar con el o o estimador de Variables Instrumentales. En el ejemplo se resume todo el tema. Las instrucciones de gretl necesarias para conseguir los resultados que se muestran las encontraris en el Anexo e 4.1: Instrucciones de gretl para el estimador de Variables Instrumentales. Estas instrucciones sern a mostradas en la Prctica de Ordenador propuesta en este tema. Tambin sern de aplicabilidad en a e a el tema siguiente. Ejemplo 4.16 En este ejemplo vamos a analizar los determinantes de la oferta laboral de las mujeres casadas14 . Para ello vamos a utilizar el archivo mroz87.gdt incluido en el programa gretl, en la carpeta de archivos de muestra Gretl. En l se dispone de observaciones de las siguientes e 15 : variables, entre otras LF P : Variable cticia que toma valor 1 si la mujer ha trabajado en 1975 y cero en otro caso HOU RS: Nmero de horas trabajadas por la esposa en 1975, (W HRS). u KL6: Nmero de hijos menores de seis aos, en la familia. u n K618: Nmero de hijos entre seis y dieciocho aos, en la familia. u n
14 Fichero mrox87.gdt, disponible en gretl pestaa Gretl. Fuente:The Sensitivity of an Empirical Model of Married n Womens Hours of Work to Economic and Statistical Assumptions, Econometrica 55, 765-799. 15 Algunas de las variables han sido renombradas para que el ejercicio resulte ms cmodo. Entre parntesis aparece a o e el nombre original utilizado en el chero para que las podis reconocer fcilmente. A la hora de reproducir el ejercicio a a en vuestro trabajo personal es aconsejable hacer el cambio de nombre sugerido.
194
Anlisis de datos a AGE: Edad de la esposa, (W A). EDU C: Aos de educacin recibidos por la esposa, (W E). n o
SARRIKO-ON 04/10
W AGE: Salario de la esposa en el momento de la encuesta, 1976, (RP W G). F AM IN C: Renta familiar en dlares de 1975. o EXP ER: Aos de experiencia en la actualidad, (AX). n
Se trata de una muestra de seccin cruzada con 428 observaciones de mujeres trabajadoras donde o el trmino trabajadoras implica que tienen un salario monetario16 . e Con la muestra anterior creamos las siguientes variables: l W AGEi = ln(W AGE)i , 2 sq EXP ERi = EXP ERi , N W IF EIN Ci = F AM IN Ci (W AGEi HOU RSi ) Dado nuestro objetivo de estudiar los determinantes de la oferta laboral de la poblacin femenina o casada, la variable a estudiar es HOU RS. Como determinantes de la misma podemos pensar en incluir en el modelo el salario en logaritmos, l W AGE, los aos de educacin recibidos, EDU C, n o la edad, AGE, el nmero de hijos de la familia, KL6 y K618, y la variable N W IF EIN C, que de u alguna manera mide la importancia de las rentas familiares que no dependen de los ingresos de la esposa. As el modelo a estimar ser , a: HOU RSi = 1 + 2 l W AGEi + 3 EDU Ci + 4 AGEi + 5 KL6i + 6 K618i + 7 N W IF EIN Ci + ui (4.3)
A priori esperar amos que los coecientes de las variables l W AGE, EDU C y K618 fuesen positivos, ceteris paribus. Es de esperar que si se tiene un sueldo alto la estimulacin a seguir trabajando sea o mayor. Tambin es lgico pensar que cuando la preparacin (estudios) es mayor, se tenga un empleo e o o mejor y mejor remunerado, luego es ms probable que la mujer trabaje fuera de casa. Familias con a mayor nmero de hijos necesitan de una mayor renta, por lo que es probable que la esposa decida u trabajar. Por otro lado, cuando hay nios pequeos podemos pensar que la esposa se retire del n n mercado de trabajo para cuidarlos, por lo que esperar amos un signo negativo en el coeciente que acompaa a KL6 manteniendo el resto de factoes constante. A mayor edad, tambin es posible n e que no se quiera trabajar fuera de casa, por lo que, esperamos signo negativo para la variable AGE ceteris paribus. Finalmente, manteniendo el resto de factores constantes tambin esperar e amos signo negativo para el coeciente de la variable N W IF EIN C ya que, si la renta disponible que no depende de la remuneracin de la mujer es alta, es probable que eso desincentive a trabajar fuera de casa a o la esposa. Es importante tener en cuenta la fecha de la recogida de datos, 1975, cuando todav la a participacin en el mercado de trabajo de la mujer no estaba consolidada. o
Este archivo es en realidad una submuestra de otro archivo original con un total de 753 observaciones de las cuales solo trabajan 428 mujeres. El archivo original es mroz.gdt, est incluido en la carpeta Wooldridge de gretl. Sin a embargo, como a lo largo del ejercicio de ver, para todos los individuos de la muestra todas las observaciones no a estn completas por lo que nalmente, el nmero utilizado de observaciones completas en el ejercicio es de 326. a u
16
195
SARRIKO-ON 04/10 Los resultados de la estimacin MCO de la ecuacin (4.3) son: o o Estimaciones MCO utilizando 326 observaciones desde 1428 Se han quitado las observaciones ausentes o incompletas: 102 Variable dependiente: HOURS Coeciente const l WAGE EDUC AGE KL6 K618 NWIFEINC 1909,20 311,7460 18,6620 8,2063 296,62 80,759 0,0098 Desv. t pica 344,1980 95,1025 18,6519 5,5617 107,6080 31,8324 0,0037 1424,990 687,015 1,38627e+08 659,217 estad stico t 5,5468 3,2780 1,0006 1,4755 2,7565 2,5370 2,6651 R2 R2 corregido F (6, 319) valor p para F ()
Anlisis de datos a
valor p 0,0000 0,0012 0,3178 0,1411 0,0062 0,0117 0,0081 0,09628 0,07928 5,66458 1,31042e-05
Media de la var. dep. D.T. de la var. dep. SCR Desv. t pica regresin ( ) o
Lo primero que llama la atencin es que las variables EDU C y K618 no tienen los signos esperados. o Por otro lado EDU C y AGE no son signicativas. Es posible que nuestro modelo no est correce e o tamente estimado? Hay razones para sospechar que l W AGE est correlada con la perturbacin del modelo? HOU RS y l W AGE se determinan conjuntamente en equilibrio entre la oferta y demanda. Luego efectos recogidos en ui que afectan al nivel de horas trabajadas tambin afectaran al e a nivel de salarios de equilibrio. Se hace indispensable saber si el nivel de salarios l W AGEi est o no correlada con la perturbacin. Es necesario contrastar: o H0 : E(l W AGEi ui ) = 0 Ha : E(l W AGEi ui ) = 0 El contraste de Hausman implica estimar el modelo adems de por MCO, por VI. a Vamos a estimar por VI utilizando como instrumento para la variable l W AGE a la variable EXP ER. En principio la variable EXP ER no tiene porque estar correlada con la perturbacin del o modelo, as E(EXP ERi ui ) = 0. Por otro lado, la correlacin muestral entre estas dos variables es o baja rl W AGE,EXP ER = 0, 216 . Sin embargo, si regresamos l W AGE sobre EXP ER incluyendo una constante la variable es signicativa, el valor muestral estad stico es 3,985. Por lo que podemos concluir que el instrumento est signicativamente correlado con la variable para la cual hace de a instrumento, E(l W AGEi EXP ERi ) = 0. La variable cumple las caracter sticas de una variable instrumental. Los resultados de la estimacin por VI utilizando como instrumento para l W AGE a la variable o EXP ER son los siguientes: 196
Anlisis de datos a
SARRIKO-ON 04/10
Estimaciones MC2E utilizando 326 observaciones desde 1428 Se han quitado las observaciones ausentes o incompletas: 102 Variable dependiente: HOURS Instrumented: l WAGE Instrumentos: const EXPER EDUC AGE KL6 K618 NWIFEINC Coeciente const l WAGE EDUC AGE KL6 K618 NWIFEINC 1334,86 2099,23 162,5070 9,4465 372,3520 3,1880 0,0124 Desv. t pica 527,6410 545,3280 50,3543 8,0821 157,8050 51,5713 0,0054 z-stat 2,5299 3,8495 3,2273 1,1688 2,3596 0,0618 2,2833 valor p 0,0114 0,0001 0,0012 0,2425 0,0183 0,9507 0,0224 687,0155 956,9807 0,032864 0,000340
Media de la var. dependiente Suma de cuadrados de los residuos R2 F (6, 319)
1424,988 2,92e+08 0,050719 4,307881
Desv. tip. var. dependiente. Desv. tip. regresin o Adjusted R2 P-value(F )
Si nos jamos en el output que muestra gretl este nos indica cual es la variable que estamos instrumentalizando, l W AGE. Si observamos la lista de instrumentos veremos que la matriz de instrumentos Z consta de siete columnas, las cuales coinciden con las columnas de la matriz de regresores a X salvo la segunda donde en lugar de la variable l W AGE aparecer el instrumento EXP ER. La referencia a MC2E de gretl se corresponde con el estimador de VI, ya que en este caso hay un instrumento y una unica variable que lo necesita. Ya podemos computar el contraste de Hausman. Recordemos que el estad stico de contraste y distribucin son: o (2,V I 2,M CO )2 d,H0 2 1 V (2,IV ) V (2,M CO ) Aplicado a la muestra obtenemos: H= (2,V I 2,M CO )2 (2099, 23 311, 746)2 3195099, 05 = = = 11, 081 2 (95, 1025)2 (545, 328) 288338, 1421 V (2,IV ) V (2,M CO )
dado que el valor muestral del estad stico es mayor que 3, 84 = 2 o 1|0,05 rechazamos la hiptesis nula y concluimos que E(l W AGEi ui ) = 0 . Luego el estimador apropiado es VI ya que MCO es inconsistente. Los signos obtenidos de la estimacin VI se mantienen con respecto a MCO. Con respecto a la o signicatividad de las variables en este caso la variable EDU C es individualmente signicativa, al contrario que con la estimacin MCO. La no signicatividad de AGE se mantiene, pero ahora o obtenemos que la variable K618 no es signicativa, cosa que no ocurr con el estimador MCO. a 197
SARRIKO-ON 04/10
Anlisis de datos a
Podemos pensar en mejorar nuestro instrumento. Que pasar si utilizramos como instrumento el a a cuadrado de la experiencia, sq EXP ER? La correlacin muestral entre estas dos variables es baja o rl W AGE,sq EXP ER = 0, 1853, algo ms baja que en el caso anterior. Si regresamos l W AGE sobre a sq EXP ER incluyendo una constante la variable es signicativa, el valor muestral del estad stico es 3,395. Concluimos que el instrumento est signicativamente correlado con la variable para la a cual hace de instrumento, E(l W AGEi sq EXP ERi ) = 0. La variable es un instrumento adecuado. Los resultados de la estimacin por VI utilizando como instrumento para l W AGE a la variable o sq EXP ER son los siguientes: Estimaciones MC2E utilizando 326 observaciones desde 1428 Se han quitado las observaciones ausentes o incompletas: 102 Variable dependiente: HOURS Instrumented: l WAGE Instrumentos: const sq EXPER EDUC AGE KL6 K618 NWIFEINC Coeciente const l WAGE EDUC AGE KL6 K618 NWIFEINC 1356,310 2032,460 157,1340 9,4002 369,5240 6,0855 0,0123 Desv. t pica 524,6080 599,0830 53,9486 7,9271 155,1580 51,9093 0,0053 z-stat 2,5854 3,3926 2,9127 1,1858 2,3816 0,1172 2,3050 valor p 0,0097 0,0007 0,0036 0,2357 0,0172 0,9067 0,0212 687,0155 938,3666 0,033534 0,001056
1424,988 2,81e+08 0,051376 3,830092
Desv. tip. var. dependiente. Desv. tip. regresin o Adjusted R2 P-value(F )
Los resultados de la estimacin por VI utilizando como instrumento a sq EXP ER no var con o an respecto a utilizar como instrumento a la variable EXP ER. Ni en cuanto a los signos obtenidos, ni en cuanto a signicatividad17 . Sin embargo, hemos de notar que si ambas son instrumentos adecuados podemos ampliar el conjunto de instrumentos incluyendo a ambas variables y considerar el estimador de MC2E utilizando todos los instrumentos para mejorar en eciencia asinttica. o Vamos a mostrar ahora los resultados de la estimacin por MC2E utilizando ambas variables como o instrumento junto con los regresores originales no correlados con la perturbacin: o
Ya hemos determinado que l W AGE es una variable correlada con la perturbacin y no es necesario computar o de nuevo el contraste de Hausman con el nuevo instrumento propuesto. An as si lo calculamos, el estad u , stico de Hausman aplicado a la muestra es: H= (2032, 23 311, 746)2 (2,V I 2,M CO )2 2960065, 194 = = = 8, 46 2,IV ) V (2,M CO ) (599, 083)2 (95, 1025)2 349855, 9554 V (
17
dado que el valor muestral del estad stico es mayor que 3, 84 = 2 o 1|0,05 rechazamos la hiptesis nula y concluimos que Ha : E(l W AGEi ui ) = 0 . Luego el estimador apropiado es VI ya que MCO es inconsistente.
198
Anlisis de datos a
SARRIKO-ON 04/10
Estimaciones MC2E utilizando 326 observaciones desde 1428 Se han quitado las observaciones ausentes o incompletas: 102 Variable dependiente: HOURS Instrumented: l WAGE Instrumentos: const EDUC AGE KL6 K618 NWIFEINC EXPER sq EXPER Coeciente const l WAGE EDUC AGE KL6 K618 NWIFEINC 1328,65 2118,57 164,0630 9,4599 373,1720 2,3488 0,0124 Desv. t pica 530,2510 544,7060 50,3799 8,1281 158,6810 51,7912 0,0054 z-stat 2,5057 3,8894 3,2565 1,1639 2,3517 0,0454 2,2757 valor p 0,0122 0,0001 0,0011 0,2445 0,0187 0,9638 0,0229 687,0155 962,4351 0,032678 0,000316
1424,988 2,95e+08 0,050536 4,338567
Desv. tip. de la var. dependiente. Desv. tip. regresin o 2 Adjusted R P-value(F )
Si analizamos el output que muestra gretl la variable que estamos instrumentalizando coincide con los casos anteriores, pero ahora en la lista de instrumentos hay ocho variables. Se incluyen EXP ER e y sq EXP ER y los regresores originales. En este caso, el trmino MC2E se corresponde totalmente con el estimador que hemos visto en la teor Hay ms de un instrumento y una unica variable que a. a lo necesita, gretl ha computado el instrumento utilizando todas las variables indicadas para obtener el estimador de VI. Los resultados de la estimacin por MC2E no cambian frente a las anteriores regresiones de VI, ni o en cuanto a los signos obtenidos, ni en cuanto a signicatividad de las variables. Los coecientes de determinacin no deben ser utilizados como medida de bondad del ajuste ya que en este caso no o tienen la interpretacin habitual. o Ejercicio 4.3 Para aanzar la comprensin del ejemplo anterior. o
1) Repetir todas las estimaciones y contrastes. 2) Calcular el estimador de MC2E paso a paso. Es decir: i) Estimar por MCO la regresin: o l W AGEi = 1 + 2 EXP ERi + 3 sq EXP ERi + 4 EDU Ci + 5 AGEi + 6 KL6i + 7 K618i + 8 N W IF EIN Ci + wi y guardar las estimaciones obtenidas, l W AGE i . ii) Computar el estimador de VI utilizando como instrumento para l W AGEi a la variable Zi = l W AGE i . 199
SARRIKO-ON 04/10 iii) Comparar las estimaciones obtenidas con las del ejemplo anterior.
Anlisis de datos a
3) Contrastar que las variables KL6 y K618 no son conjuntamente signicativas. Razona la estimacin elegida para realizar el contraste. o
4.5.
A continuacin se proponen varios ejercicios para que el alumno vaya resolviendo a la vez que se va o explicando la materia en las clases magistrales y cuyas dudas se resolvern a lo largo de estas: a Ejercicio M-RE.1 En el modelo: Yt = 1 + 2 X2t + 3 X3t + ut ut iid(0, 2 ) donde X2t es una variable no estocstica y X3t es una variable aleatoria. Denotamos por al vector a de coecientes desconocidos de orden (3 1). 1. Por qu el estimador de MCO no es lineal? e 2. Qu supuesto te garantiza que el estimador de por el mtodo de M e e nimos Cuadrados Ordinarios sea insesgado? Demustralo. e 3. Si X3t es estocstica y no independiente de ut , pero E(X3t ut ) = 0 t, es el estimador de a por MCO consistente? Demustralo e indica los supuestos adicionales que te sean necesarios. e 4. Si X3t es estocstica, pero se satisface el Teorema de Mann y Wald, podemos hacer inferencia a sobre a pesar de no conocer la distribucin de ut ? Razona tu respuesta. o
Ejercicio M-RE.2 Se dispone de 62 observaciones sobre las siguientes caracter sticas de los terremotos registrados en Alaska durante el periodo 1969-197818 : Yt : El logaritmo de la amplitud de onda en metros por segundo, (m/sg). Xt : El logaritmo de la amplitud del cuerpo longitudinal de la onda en m/sg. Wt : El logaritmo de la traza mxima de amplitud de onda a corta distancia en m/sg. a Se quiere estimar cul es el efecto sobre Yt de la velocidad de amplitud del cuerpo de la onda de un a terremoto, Xt , mediante el modelo:
Yt = 1 + 2 Xt + vt
18
2 vt N ID(0, v )
(4.4)
Fuente: Fuller, W.A. (1987), Measurement Error Models. Wiley, New York.
200
Anlisis de datos a
SARRIKO-ON 04/10
La tecnolog existente no permite obtener directamente el valor de la variable no estocstica Xt por a a +e , donde X es la variable observada y el error de medida es lo que se aproxima mediante Xt = Xt t t 2 et NID(0, e ). Adems, la perturbacin del modelo, v, y el error de medida, e, son independientes. a o Se han obtenido los siguientes resultados a partir del estimador de M nimos Cuadrados Ordinarios:
Yt = 1,491 + 1,261 Xt + ut , (0,780) (0,149) (des(i,M CO )) 2, 118 0, 403 0, 403 0, 077

1
SCR = 17,242.
(X X)
1. Obtn paso a paso cada uno de los siguientes valores: e ut = E(ut ) = V ar(ut ) = Cov(ut , us ) = E(Xt ut ) = 2. Razona las propiedades en muestras nitas y asintticas del estimador MCO. o
El modelo anterior ha sido reestimado por Variables Instrumentales. Para ello se ha utilizado como instrumento para el regresor Xt a la variable Wt , cuya medicin se puede realizar con exactitud. Se o han obtenido los siguientes resultados: Yt = 4,287 + 1,797 Xt + t , (1,114) (0,213) (des(i,V I )) SCR = 20,961.
3. Escribe expl citamente la frmula del estimador de VI y su expresin en trminos de sumatoo o e rios. 4. Escribe expl citamente las condiciones necesarias y sucientes para que el estimador de VI sea consistente. 5. Lleva a cabo el contraste de Hausman para analizar si es o no importante el problema de error de medida. Escribe la hiptesis nula, la alternativa y todos los elementos del contraste, o as como su conclusin. o
201
SARRIKO-ON 04/10
Anlisis de datos a
6. Contrasta la hiptesis de que, en media, la amplitud del cuerpo longitudinal de la onda recoo gida en un sismgrafo no es relevante sobre la amplitud de la onda. o
Ejercicio M-RE.3 Se quiere estimar el modelo: Yt = X1t + ut ut iid(0, 2 ) (4.5)
y se sabe que X1t se determina con Yt ya que X1t = Yt + X2t donde E(X2t ut ) = 0 t. 1. Demuestra que E(X1t ut ) = (1 )1 2 . Se supone que = 1. 2. Qu implicaciones tiene este hecho en el estimador de aplicando el mtodo de M e e nimos Cuadrados Ordinarios (MCO) a (4.5)? Razona la respuesta. 3. Escribe expl citamente la frmula de un estimador de alternativo para este modelo concreto o razonando por qu lo escoger e as. Si se dispone de una muestra de 60 observaciones donde se han obtenido los siguientes productos cruzados: Yt 100 X1t 40 80 X2t -60 40 100
Yt X1t X2t por ejemplo Yt X2t = 60.
4. Obtn la estimacin de por el mtodo propuesto en el apartado 3 y por el mtodo de MCO. e o e e 5. Contrasta al nivel de signicacin del 5 % la H0 : = 0. (Suponer que 2 = 1.) o 6. Si el investigador ignorara que X1t = Yt +X2t , cmo podr darse cuenta de que E(X1t ut ) = 0? o a Explica y realiza el contraste. (Suponer que 2 = 1.)
Ejercicio M-RE.4 Se quiere evaluar el rendimiento de la educacin en trminos del siguiente modelo o e Yi = 1 + 2 EDUi + wi i = 1, . . . , N
donde Yi y EDUi son las ganancias salariales anuales (en decenas de miles de euros) y el nivel de educacin de un individuo respectivamente. Adems, E(EDUi wi ) = 0 para todo i y wi es un ruido o a blanco. 202
Anlisis de datos a
SARRIKO-ON 04/10
Se dispone de una muestra de 1000 individuos. Sin embargo, se mide el nivel de educacin a travs o e de la variable observada, aos de estudio, Si , que est medida con error, tal que Si = EDUi + i n a donde i es un ruido blanco independiente de EDUi y de wi . Utilizando el mtodo de M e nimos Cuadrados Ordinarios en base a la informacin muestral disponio ble, se han obtenido los siguientes resultados: Yi = 2, 431 + 0, 03332 Si (0,0046) (0,078) (des(M CO )) 1. Interpreta qu indica la estimacin obtenida para el parmetro 2 . e o a 2. Explica en detalle qu propiedades tendr el estimador MCO de 1 y 2 si se ha utilizado la e a medida de educacin disponible Si en lugar de EDUi en el modelo. Razona tu respuesta. o
Disponemos de una variable adicional Pi , que mide los aos de educacin del padre de ese individuo n o i. Para la muestra de 1000 individuos se tiene la siguiente informacin: o
i Yi i Pi 2 i Yi
= 2988, 232 = 14343 = 9028, 9
i Si
= 16707 = 42914, 7
i Yi Si i Pi Si
= 50071, 6 = 240466
2 i Si 2 i Pi
= 283539 = 206469
i Yi Pi
3. Propn un estimador consistente, alternativo al de MCO, razonando bajo qu condiciones o e ser consistente y cul ser su distribucin asinttica. a a a o o 4. Calcula la estimacin de 1 y 2 en base al estimador propuesto en el apartado anterior. o 5. Si se ha utilizado un estimador consistente, cmo se ha obtenido la siguiente estimacin de la o o matriz de varianzas y covarianzas asinttica del estimador propuesto en el apartado 3? Indica o todos los pasos que se han realizado hasta llegar a este resultado. 98, 88 V () = 998 0, 2984084 0, 017800 0, 017800 0, 001065
6. Utilizando el estimador propuesto en el apartado 3, contrasta la hiptesis de que un ao adio n cional de educacin supone un incremento medio en las ganancias salariales anuales de 720 o euros. Escribe la hiptesis nula, la alternativa y todos los elementos del contraste. o 7. Lleva a cabo el contraste de Hausman para analizar si es o no importante el problema de error de medida. Escribe la hiptesis nula, la alternativa y todos los elementos del contraste. o
203
SARRIKO-ON 04/10
Anlisis de datos a
8. Indica de manera razonada cul de los dos estimadores elegir teniendo en cuenta el resula as tado del contraste de Hausman.
Ejercicio M-RE.5 Considera el siguiente modelo de regresin: o Yi = 1 + 2 Xi + ui i = 1, . . . , N (4.6)
donde Xi es estocstica, ui N (0, 2 ), E(ui uj ) = 0 para i = j y donde E(Xi ui ) = 0, 9. a 1. Qu problema existe en el modelo anterior? Cmo podr detectarse? Explica en detalle el e o a contraste que propones y las consecuencias de rechazar o no la nula. 2. Qu consecuencias tiene en los contrastes de hiptesis sobre 1 y 2 la utilizacin del estie o o mador MCO y el de VI? Razona tu respuesta en cada caso. Se dispone de una muestra de 500 observaciones que da lugar a las siguientes sumas de cuadrados y de productos cruzados19 :
1 Yi Xi Z1i donde por ejemplo
1 500
Yi 1530,17 7163,54
Xi 14,48 1551,83 1037,57
Z1i -0,23 448,79 451,24 509,40
Yi Xi = 1551, 83 y
Yi = 1530, 17.
3. Utilizando la informacin muestral dada, completa todos los elementos dentro de las matrices o para la obtencin de las estimaciones de 1 y 2 por VI, considerando como unico instrumento o a Z1 : = 1 3, 03 = 0, 996
V I
19
Fuente: Libro Undergraduate Econometrics, de Hill, Griths y Judge (2001).
204
Anlisis de datos a
SARRIKO-ON 04/10
Con los datos de la tabla anterior se ha obtenido la siguiente estimacin de la matriz de o varianzas y covarianzas del anterior estimador VI de 1 y 2 : V (V I ) = 0,00203608 -0,000074 0,002544
Completa la ecuacin del modelo estimado: o Yt = ( (des(V I )) ... ) ( )
4. Bajo qu condiciones es consistente el estimador VI del apartado anterior? Es un estimador e asintticamente eciente? Razona tu respuesta. o 5. Para realizar el contraste H0 : 1 = 3 2 = 1: Escribe el estad stico de contraste y su distribucin: o Detalla cada uno de los elementos del estad stico anterior: Utilizando la siguiente informacin y el estimador del apartado 3) realiza el contraste: o Conjunto de restricciones 1: b[const] = 3 2: b[X] = 1 Valor muestral del estadstico de contraste: chi^2(2) = 0,490224, con valor p = 0,782617. .
Se ha considerado un estimador alternativo al utilizado en el apartado 3) obtenindose los siguientes e resultados en gretl. Estimaciones MC2E utilizando las 500 observaciones 1500 Variable dependiente: Y Instrumentos: const Z1 Z2 Variable const X Coeciente 3,03113 1,00899 Desv. t pica 0,0445796 0,0448997 Estad stico t 67,9936 22,4721 valor p 0,0000 0,0000
6. Explica paso a paso la obtencin de este estimador Es mejor que el anterior? En qu sentido? o e Razona tu respuesta.
205
SARRIKO-ON 04/10
Anlisis de datos a
4.6.
Prcticas de Aula a
El tema de Regresores Estocsticos tiene una dicultad considerable ya que los conceptos tericos a o relacionados con teor asinttica no son sencillos de comprender. Por ello las prcticas de aula a o a son de una gran importancia. Ms si cabe cuando el tema siguiente seguir profundizando en los a a conceptos manejados en este tema. La resolucin individual por parte del alumno de los ejercicios o propuestos en las prcticas de aula, en su tiempo de estudio no presencial, le permitir participar a a en clase contestando a las preguntas que se le realicen o poniendo en comn dudas y comentarios u surgidos. Previamente y con anticipacin suciente se le habr realizado la debida propuesta. o a En el tema de Regresores Estocsticos es habitual disponer de dos prcticas de aula, lo que equivale a a a dos horas de clase presencial y cuatro horas de trabajo personal. Si el ejercicio ha sido realizado previamente por el alumno el tiempo es suciente para su correccin y solucin de dudas existentes. o o A continuacin se van a proponer los enunciados correspondientes a las dos prcticas citadas. o a
Competencias a trabajar en estas sesiones. 1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e
Prctica de Aula PA-RE.1: a Un estudiante est realizando su proyecto de n de carrera sobre la demanda de pescado en el a Fulton Fish Market, un mercado localizado en Nueva York y que opera desde hace 150 aos. Para n ello dispone de una muestra de 111 observaciones de datos diarios, desde el 2 de diciembre de 1991 al 8 de mayo de 1992, sobre las siguientes variables: lquan: Cantidad de merluza vendida en libras (en logaritmos). lprice: Precio de merluza por libra (en logaritmos). mon: Variable cticia que toma valor 1 en lunes y 0 en otro caso. tue: Variable cticia que toma valor 1 en martes y 0 en otro caso. wed: Variable cticia que toma valor 1 en mircoles y 0 en otro caso. e thu: Variable cticia que toma valor 1 en jueves y 0 en otro caso. stormy: Variable cticia que toma valor 1 si ese d hizo mucho viento y oleaje, 0 en otro caso. a 206
Anlisis de datos a La especicacin para la ecuacin de demanda es la siguiente: o o
SARRIKO-ON 04/10
lquant = 1 + 2 lpricet + 3 mont + 4 tuet + 5 wedt + 6 thut + ut y los resultados de la estimacin por MCO se muestran a continuacin: o o Ecuacin de demanda: estimaciones MCO o Variable dependiente: lquan Variable const lprice mon tue wed thu Coeciente 8,606890 0,562550 0,014316 0,516242 0,555373 0,081621 Desv. t pica 0,143043 0,168213 0,202647 0,197690 0,202319 0,197817 Estad stico t 60,1698 3,3443 0,0706 2,6114 2,7450 0,4126 47,1672 0,220486 valor p 0,0000 0,0011 0,9438 0,0103 0,0071 0,6807
El estudiante en su proyecto se cuestiona si, al ser un modelo en el que el precio y la cantidad se determinan conjuntamente en equilibrio entre oferta y demanda, la variable lprice pueda ser endgena, y estar correlacionada con el error de la ecuacin. Por ello realiza la siguiente estimacin: o o o Ecuacin de demanda: estimaciones MC2E o Variable dependiente: lquan Instrumented: stormy Instrumentos: const stormy mon tue wed thu Variable const lprice mon tue wed thu Coeciente 8,505910 1,119400 0,025402 0,530769 0,566351 0,109267 Desv. t pica 0,166167 0,428645 0,214774 0,208000 0,212755 0,208787 Estad stico t 51,1890 2,6115 0,1183 2,5518 2,6620 0,5233 valor p 0,0000 0,0090 0,9059 0,0107 0,0078 0,6007
1. Explica en detalle como se han obtenido las estimaciones MC2E mostradas. Escribe de forma expl cita cada una de las matrices que intervienen en la expresin del estimador. o 2. Escribe y explica las condiciones tanto para poder obtener el estimador MC2E como para que ste sea consistente. e
207
SARRIKO-ON 04/10
Anlisis de datos a
3. Contrasta la sospecha del estudiante. Escribe la hiptesis nula, la alternativa, el estad o stico de contraste y su distribucin bajo la hiptesis nula. o o 4. A la luz del resultado del contraste, qu estimador elegir e as? Razona tu respuesta en trminos e de las propiedades de los estimadores. 5. Contrasta la hiptesis nula de que una variacin porcentual unitaria en el precio de la merluza o o se traduce en una variacin porcentual unitaria en la cantidad demandada de merluza en ese o mercado.
Prctica de Aula PA-RE.2: a Sea el siguiente modelo: Yt = 1 X1t + 2 X2t + ut donde X1t = Zt + t
2 ut iid(0, u )
t = 1, 2, . . . , T
(4.7)
2 t iid(0, ) y X2t y Zt son variables no estocsticas. a
1. Cundo estimar el modelo por el mtodo de Variables Instrumentales utilizando la variable a as e Zt como instrumento para la variable X1t ? Por qu? Crea problemas la variable X2t ? Por e qu? e A partir de una muestra de 52 observaciones se han obtenido los siguientes productos cruzados:
Yt Yt X1t X2t Zt
por ejemplo X1t X2t = 40
X1t 80 100
X2t -60 -40 80
Zt 60 -10 50 40
100
2. Siendo Zt el instrumento para X1t , estima los coecientes 1 y 2 del modelo utilizando el mtodo de variables instrumentales. e Los resultados de estimar por MCO el modelo han sido: Yt = 0, 625 X1t 0, 4375 X2t i,M CO )) (0,077) (0,086) (des( 208 (4.8)
Anlisis de datos a 3. Contrasta la H0 : E(X1t ut ) = 0 sabiendo que: V (V I ) = 2, 1166 1, 0583 1, 0583 1, 2254
SARRIKO-ON 04/10
Como conclusin del resultado del contraste cul es el mtodo adecuado para estimar el o a e modelo (4.8)? Qu propiedades tienen dichos estimadores? e
4.7.
En el tema de Regresores Estocsticos es habitual disponer de una prctica de ordenador que equia a vale a una hora presencial y dos horas de trabajo no presencial. A continuacin se va a proponer o un ejercicio para resolver en el centro de clculo. El enunciado cubre todo lo aprendido en el tema. a Enfatizamos que es conveniente que una vez acabado el ejercicio y en vuestro tiempo de trabajo personal deis contenido al mismo. Es decir, en clase unicamente nos da tiempo a aprender como ir obteniendo los resultados con gretl. Aunque el profesor va comentando y explicando los resultados. Vosotros y de forma personal debis redactar convenientemente las respuestas de cada apartado. e Notar que en algunos de ellos se incluye la coletilla A realizar en casa por esa razn. En el Anexo o 4.1. aparecen las instrucciones de gretl para regresores estocsticos. a Competencias a trabajar en estas sesiones. 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e 3. Utilizar diversas fuentes estad sticas y adquirir destreza en el uso de un software economtrico e para analizar relaciones entre variables econmicas. o
Prctica de Ordenador PO-RE.1 a Para la realizacin de este ejercicio utilizamos el chero de datos smoke del libro de Wooldridge o que tenis como archivo de muestra en gretl. Son datos para 807 individuos varones residentes en e distintos estados americanos en el ao 1979. Las variables que estn en este chero son: n a income: renta familiar anual en miles de dlares. o lincome: logaritmo de la renta familiar anual en miles de dlares. o cigs: el nmero medio de cigarrillos fumados por d u a. educ: el nmero de aos escolarizado. u n age: edad del individuo en aos. n 209
SARRIKO-ON 04/10 agesq: edad del individuo en aos elevado al cuadrado. n cigpric: el precio de un paquete de cigarrillos en centavos. lcigpric: logaritmo del precio de un paquete de cigarrillos en centavos.
Anlisis de datos a
restaurn: variable cticia que es igual a la unidad si una persona reside en un estado donde hay restricciones al tabaquismo en los restaurantes, cero en otro caso. white: variable cticia que es igual a la unidad si el individuo es blanco, cero en otro caso. Puedes acceder a estos datos ejecutando gretl En Archivo Abrir datos Archivo de muestra Elige Wooldridge, chero smoke20 Considera la especicacin del Modelo (4.9): o lincomei = 1 + 2 cigsi + 3 educi + 4 agei + 5 agesqi + ui 1. Muestra los resultados de la estimacin por MCO del Modelo (4.9). o 2. Comenta los resultados obtenidos sobre la bondad de ajuste, los coecientes estimados y su signicatividad. (A realizar en casa). 3. Hay evidencia de que la relacin entre la variable lincome y age sea cuadrtica, manteniendo o a constante el resto de las variables explicativas? Muestra los resultados del contraste utilizado para tus conclusiones. (A realizar en casa). 4. Se cree que el consumo de cigarrillos puede estar determinado conjuntamente con la renta, tal que la variable cigs es un regresor estocstico correlacionado con el trmino de perturbacin a e o del Modelo (4.9). Explica las consecuencias que esto tiene sobre los resultados obtenidos en los apartados anteriores. (A realizar en casa). 5. Muestra los resultados de estimar el Modelo (4.9) por el mtodo de Variables Instrumene tales utilizando la variable restaurn como instrumento para cigs. Son los resultados muy diferentes a los obtenidos por MCO? Comenta estos resultados. 6. Escribe la matriz de instrumentos Z y la matriz de variables explicativas del modelo, X. No pongas los valores muestrales, simplemente utiliza los nombres de las variables en las columnas. Escribe su dimensin. (A realizar en casa). o 7. Escribe la expresin del estimador de VI utilizado. Escribe los elementos de Z X y Z Y o utilizando sumatorios y su dimensin. Qu caracter o e sticas tiene que tener Z para que el estimador se pueda obtener? Qu condiciones tiene que satisfacer Z para que el estimador e tenga propiedades deseables y los contrastes sean vlidos? (A realizar en casa). a 8. Se dispone adems de otro instrumento adicional para cigs, la variable lcigpric. Estima el a Modelo (4.9) por M nimos Cuadrados en 2 Etapas utilizando todos los instrumentos. Muestra el resultado obtenido en gretl. Compara estos resultados con los obtenidos en el apartado 5).
20 Fichero smoke, disponible en gretl pesta a Wooldridge. Fuente: Wooldridge, J. M. (2003): Introductory Econon metrics, chero smoke.
(4.9)
210
Anlisis de datos a
SARRIKO-ON 04/10
9. Calcula las correlaciones entre los instrumentos y la variable cigs. Qu indican estas corree laciones sobre la bondad de estos instrumentos? 10. Realiza la regresin de la variable cigs sobre todos los posibles instrumentos incluida la o constante: cigs = 1 + 2 educ + 3 age + 4 age2 + 5 lcigpric + 6 restaurn + ui (4.10)
Guarda la serie ajustada de la regresin cigsi i = 1, . . . , 879 y utiliza esta variable como inso trumento para cigs. Obtienes los mismos resultados que en el apartado 8)? Por qu obtienes e esos resultados? Son las variables lcigpric y restaurn signicativas? 11. Realiza el contraste de Hausman para los resultados del apartado 5). A la vista del resultado Cmo estimar los coecientes del Modelo (4.9)? o as 12. Contrasta si la variable edad es signicativa. En cunto se estima el cambio en la renta cuando a el individuo tiene un ao adicional y el resto de las caracter n sticas se mantienen constantes? Es esta variacin la misma para todos los individuos en la muestra? o
4.8.
Se recuerda que dado que el curso contempla la evaluacin continua es necesario que a lo largo o del tema se evale a los alumnos, tanto en las clases magistrales, como en las prcticas de aula y u a ordenador. Se llevan a cabo en clase y de manera individual. A modo de ejemplo se incluyen las siguientes. Preguntas cortas en Clases Magistrales:
Pc1. Marca lo que sea cierto:

2 a) Si Xt = 5 + vt vt iid(0, v ) a) Xt es una variable constante
b) Xt es una variable aleatoria
2 b) Sea ut iid(0, u ) y Xt una variable no estocstica: a a) E(Xt ut ) = 0 b) E(Xt ut ) = 0 2 a c) Sea ut iid(0, u ) y Xt una variable estocstica independiente de ut a) E(Xt ut ) = 0 b) E(Xt ut ) = 0
t:
2 a a o d ) Sean ut iid(0, u ), Xt una variable estocstica y adems, la correlacin entre Xt y ut no es cero. a) E(Xt ut ) = 0 b) E(Xt ut ) = 0 2 a Pc2. En el MRLG Y = X + u con ut iid(0, u ) y X matriz de regresores estocstica independiente de u. Para cada apartado, marca lo que sea cierto. El estimador M CO = + (X X)1 (X u):
211
SARRIKO-ON 04/10 1. a) Es lineal en u. b) Es no lineal en u. 2. a) Es insesgado. b) Es sesgado. 3. a) Tiene distribucin conocida en muestras nitas. o b) No tiene distribucin conocida en muestras nitas. o
Anlisis de datos a
Preguntas cortas en Prctica de Aula: a Se dispone de 585 observaciones sobre las siguientes variables para el ao 1970: n
SAVE: Ahorro anual de la familia i. INCOME: Renta agregada anual de la familia i. SIZE: Tamao de la familia i. n Se considera la especicacin del Modelo (4.11): o
SAV Ei = 1 + 2 IN COM Ei + ui
2 tal que E(IN COM Ei ui ) = 0, E(SIZEi ui ) = 0, E(ui ) = 0, E(u2 ) = u . i
(4.11)
Pc1. Por qu se deber estimar por VI y no por MCO los coecientes de la relacin anterior? e a o Pc2. Escribe la matriz de instrumentos Z y la matriz de variables explicativas del modelo, X. Escribe su dimensin. o Z= X=
Pc3. Escribe la expresin del estimador de VI utilizado. Escribe los elementos de Z X y Z Y utilio zando sumatorios. 212
Anlisis de datos a
SARRIKO-ON 04/10
V I
Pc4. Qu caracter e sticas tiene que tener Z para que el estimador se pueda obtener? Qu condicioe nes tiene que satisfacer Z para que el estimador tenga propiedades deseables y los contrastes sean vlidos? a
Preguntas cortas en Prctica de Ordenador: a Se dispone de una muestra de 111 observaciones de datos diarios, desde el 2 de diciembre de 1991 al 8 de mayo de 1992, sobre las siguientes variables: lquan: Cantidad de merluza vendida en libras (en logaritmos). lprice: Precio de merluza por libra (en logaritmos). mon: Variable cticia que toma valor 1 en lunes y 0 en otro caso. tue: Variable cticia que toma valor 1 en martes y 0 en otro caso. wed: Variable cticia que toma valor 1 en mircoles y 0 en otro caso. e thu: Variable cticia que toma valor 1 en jueves y 0 en otro caso. stormy: Variable cticia que toma valor 1 si ese d hizo mucho viento y oleaje, 0 en otro caso. a El chero de datos est disponible en la direccin: http://people.brandeis.edu/kgraddy/data.html a o La especicacin para la ecuacin de demanda es la siguiente: o o lquant = 1 + 2 lpricet + 3 mont + 4 tuet + 5 wedt + 6 thut + ut Pc1. Estima el modelo anterior por VI utilizando como instrumento para lprice a la variable stormy y completa:
lquant = ............... i,V I )) (.............) (desv(
............... lpricet (.............)
............... mont (.............) ............... thut (.............)
............... tuet (.............) 213
............... wedt (.............)
SARRIKO-ON 04/10
Anlisis de datos a
Pc2. Contrasta la posibilidad de que la variable estocstica lprice est correlada con la perturbacin. a e o a) H0 : Ha :
b) Estad stico de contraste y distribucin: o c) Computa el estad stico de contraste y lleva a cabo el contraste: d ) A la vista de los resultados del contraste propn un mtodo de estimacin adecuado para o e o los coecientes de la relacin y enumera sus propiedades. o
214
Anlisis de datos a
SARRIKO-ON 04/10
4.9.
Referencias Bibliogrcas Bsicas: a a Terica: o [1] Greene, W. (1998), Anlisis Economtrico, ed. Prentice Hall, 3a edition. a e [2] Ramanathan, R. (2002), Introductory Econometrics with applications, ed. South-Western, 5th edition. [3] Wooldridge, J. M. (2003), Introductory Econometrics: A modern Approach, ed. South-Western, 2nd edition. Ejercicios: [1] Alegre, J., Arcarons, J., Bolanc, C. y D L. (1995), Ejercicios y Problemas de Econometr e az, a, Coleccin Plan Nuevo, ediciones AC. o [2] Fernndez, A., Gonzlez, P., Reglez, M., Moral, P., Esteban, V. (2005), Ejercicios de Econoa a u metr ed. McGraw-Hill, 2 a edicin. a, o [3] Recopilacin de ejercicios recomendados y exmenes de Econometr Departamento de Econom o a a. a Aplicada III (Econometr y Estad a stica). Mimeo Febrero 2009. Ejercicios con gretl: [1] Ramanathan, R. (2002) Instructors Manual to accompany, del libro Introductory Econometrics with applications, ed. South-Western, 5th edition, Harcourt College Publishers. [2] Wooldridge, J.M. (2003), Student Solutions Manual, del libro Introductory Econometrics: A modern Approach, ed. South-Western, 2nd edition. Referencias Bibliogrcas Complementarias: a [1] Alonso, A., Fernndez, J. y Gallastegui, I. (2005), Econometr ed. Pearson: Prentice Hall. a a, [2] Gujarati, D. (2004), Econometr ed. McGraw-Hill, 4a edicin. a, o [3] Johnston, J. (1984), Mtodos de Econometr ed. Vicens Vivens, 4a edicin. e a, o [4] Maddala, G. S. (1996), Introduccin a la Econometr ed. Pearson: Prentice Hall. o a, [5] Novales, A. (1993), Econometr ed. McGraw-Hill, 2a edicin. a, o [6] Pindyck, R. S. y Rubinfeld, D. L. (1998), Econometric Models and Economic Forecast, ed. McGraw-Hill, 4a edicin. o
215
SARRIKO-ON 04/10
Anlisis de datos a
4.10.
Anexo 4.1: Instrucciones bsicas de gretl para regresores esa tocsticos a
En este anexo se van a recoger las instrucciones bsicas que incluye gretl para poder computar el a estimador de VI con el n de que podis llevar a cabo la prctica de ordenador con cierta soltura. a a Instrucciones de carcter bsico ya han sido recogidas en temas anteriores. a a Para computar el estimador de Variables Instrumentales: Pulsar sucesivamente en Modelo Otros modelos lineales M nimos cuadrados en dos etapas Seleccionar la variable endgena y las variables independientes de la manera habitual. o A continuacin seleccionar los instrumentos. o Hay que tener en cuenta que le estamos indicando a gretl como es la matriz de instrumentos Z y que debe tener tantas columnas como la matriz X que recoge a las variables independientes. Luego debemos incluir como m nimo tantos instrumentos como regresores tenga el modelo. Para aquellas variables no estocsticas o que no estn correlacionadas con la perturbacin el mejor instrumena e o to son ellas mismas. Para aquellas variables correlacionadas con la perturbacin se selecciona el o instrumento-(s) adecuado-(s). No es necesario respetar el mismo orden que al incluir las variables independientes. En ocasiones los instrumentos a incluir son retardos de los regresores. En este caso en la ventana gretl: especicar modelo tenemos que elegir la variable dependiente, las variables explicativas en t o corrientes y los instrumentos que estarn en la lista en t. a A continuacin se pulsa en retardos y aparece una ventana donde se tienen que seleccionar los o retardos de las variables que aparecen en el modelo como regresores, tanto de variables exgenas o como de la dependiente y tambin las variables que vamos a usar como instrumentos. e
216
Anlisis de datos a
SARRIKO-ON 04/10
4.11.
Anexo 4.2. Errores de medida en las variables
Hasta ahora hemos supuesto que las variables utilizadas en el proceso de estimacin se med sin o an error. En la prctica es muy posible que existan errores de medida en las variables o que simplemente a las variables a utilizar no sean, sino estimaciones de conceptos tericos que no se observan en la o realidad, por ejemplo el stock de capital, el PIB, o las variables de Contabilidad Nacional. Estas situaciones alterarn las propiedades de los estimadores de los coecientes en concreto introduciendo a sesgos en las estimaciones y generando estimadores de MCO inconsistentes. A continuacin vamos o a repasar esas propiedades. Podemos distinguir tres situaciones: 1. Variable endgena medida con error. o 2. Variable exgena medida con error. Analizada en el tema. o 3. Variable exgena y endgena medidas con error. o o
4.11.1.
Variable endgena medida con error o
Sea el verdadero modelo: Yt = + Xt + ut

2 ut iid(0, u )
t = 1, 2, . . . , T
donde Xt es no estocstica. Por alguna razn la variable endgena disponible no es Yt , sino Yt = a o o Yt + t con t iid(0, 2 ), Cov(Xt , t ) = 0, Cov(ut , t ) = 0. El modelo estimable en trminos de las variables observables es: e Yt
t
= + Xt + ut
Yt = + Xt + (ut + t ) Yt = + Xt + ut
El error de medida en la variable endgena se acumula en la perturbacin original. Las propiedades o o de la nueva perturbacin ut son: o E(ut ) V ar(ut ) = E(ut + t ) = E(ut ) + E( t ) = 0 = E(ut E(ut ))2 = E(ut )2 = E(ut + t )2 2 homocedstica a = E(ut 2 ) + E( 2 ) + 2E(ut t ) = u + 2 t Cov(ut , us ) = E[(ut E(ut ))(us E(us ))] = no autocorrelada = E(ut us ) = E(ut + t , us + s ) = 0
2 ut iid(0, u + 2 )
En este caso, en presencia de errores de medida en la variable endgena y cuando el error de o medida es incorrelado con la perturbacin del modelo original el error de medida se traslada a la o perturbacin del modelo estimable, incrementndola, pero se mantienen sus propiedades esfricas. o a e Por tanto, los MCO son apropiados y tienen buenas propiedades. 217
SARRIKO-ON 04/10
Anlisis de datos a
4.11.2.
Variable exgena y variable endgena medidas con error o o

Yt = + Xt + ut t = 1, 2, . . . , T
Sea el verdadero modelo: donde : Yt = Yt + t es la variable endgena disponible. o Xt = Xt + vt es la variable exgena disponible, y Xt es no estocstica o a 2 ) v iid(0, 2 ) 2) ut iid(0, u t t N (0, v Cov(ut , t ) = Cov(ut , vt ) = Cov( t , vt ) = 0 El modelo estimable en trminos de las variables observables es: e Yt
t
= + (Xt vt ) + ut
t
t = 1, 2, . . . , T t = 1, 2, . . . , T
Yt = + Xt + (ut +
vt )
Yt = + Xt + ut
t = 1, 2, . . . , T
La perturbacin del modelo estimable es homocedstica y no autocorrelada o a

2 2 ut iid(0, u + 2 + 2 v )
Existe correlacin contempornea ya que: o a E(Xt ut ) = E(Xt + vt )(ut + t vt ) = 2 = E(Xt ut ) + E(vt ut ) + E(Xt t ) + E(vt t ) E(Xt vt ) E(vt ) = 2 = v No existe correlacin no contempornea ya que E(Xs ut ) = 0 o a En este caso existen dos fuentes de error, el error de medida en la variable endgena y el error de o medida en la variable exgena. El error de medida en la variable endgena implica un incremento en o o la varianza de la perturbacin del modelo estimable mientras que el error de medida en la variable o exgena implica que los estimadores MCO de y sern sesgados e inconsistentes. El modelo o a estimable, bajo todos los supuestos realizados anteriormente, deber ser estimado por el Mtodo a e de Variables Instrumentales.
218
Anlisis de datos a
SARRIKO-ON 04/10
4.12.
Anexo 4.3. Estimador de Variables Instrumentales
A continuacin se va a mostrar, a partir de la funcin objetivo, cmo obtener el estimador de o o o Variables Instrumentales. Demostracin: o Y = X + u Z Y = Z X + Z u Denotamos por u = Z u u = Z u = Z (Y X) u = Z u = Z (Y X ) u u = Z (Y X ) Z (Y X ) = (Y X ) ZZ (Y X ) La funcin objetivo podemos escribirla como: o M in u u = M in Y ZZ Y 2 X ZZ Y + X ZZ X
por las condiciones de primer orden obtenemos: ( u ) u = 2X ZZ Y + 2X ZZ X = 0 = X ZZ (Y X ) = 0
De donde las ecuaciones normales del modelo ser an: X ZZ X = X ZZ Y tal que: V I V I V I = (X ZZ X)1 (X ZZ Y ) = (Z X)1 (X Z)1 (X Z)(Z Y ) = (Z X)1 (Z Y )
219
SARRIKO-ON 04/10
Anlisis de datos a
4.13.
Anexo 4.4. Estimador de M nimos Cuadrados en dos etapas
A continuacin vamos a mostrar como derivar el estimador de MC2E. Sea el modelo en forma o matricial: Y
(T 1)
+ u
(T 1)
Y
(T 1)
= X1
+ X2
+ u
(T 1)
u (0, 2 I)
(T K) (K1)
(T K1 ) (K1 1)
(T K2 ) (K2 1)
. . a La matriz X = [ X1 . X2 ] es estocstica y tal que E(X1 u) = 0 y E(X2 u) = 0 . Para la matriz de instrumentos Z necesitaremos al menos K2 instrumentos para las variables X2 adems, de poder a utilizar a X1 como instrumentos para ellas mismas. . . Z = [X1 . X2 ] donde l K
(T l)
Si l = K entonces tenemos exactamente el mismo nmero de instrumentos que necesitamos. u (Z X) es una matriz cuadrada de orden (K K) y no singular tal que existe (Z X)1 y podemos denir el estimador de Variables Instrumentales de la forma V I = (Z X)1 Z Y . Si l > K entonces tenemos ms instrumentos que los que necesitamos (Z X) es de orden a (l K) y no es cuadrada. El proceso de estimacin que comprende el estimador de M o nimos Cuadrados en dos Etapas es el siguiente: En la primera etapa se lleva a cabo la regresin de cada una de las columnas de la matriz X sobre o Z para obtener una matriz de valores ajustados X. X
(T K)
= Z (Z Z) 1 Z
(T l) (ll)
= Pz X
donde Pz = Z(Z Z)1 Z
(lT ) (T K)
matriz de coecientes de las K-regresiones
Pz es idempotente y simtrica, Pz = Pz y Pz Pz = Pz . e En la segunda etapa se realiza la regresin de Y sobre X para obtener el estimador de los coecientes o por M nimos Cuadrados en 2 Etapas. M C2E = (X X)1 X Y = = (X Pz Pz X)1 X Pz Y = (X Pz X)1 X Pz Y = Pz = (X X)1 X Y = (X Z(Z Z)1 Z X)1 X Z(Z Z)1 Z Y luego el estimador de MC2E es un estimador de Variables Instrumentales que utiliza como matriz de instrumentos a X = Pz X donde combina todos los instrumentos de forma ptima en el sentido o de que es un estimador consistente y es el ms eciente asintticamente dentro de la clase de a o estimadores de VI que toman solamente un subconjunto de todos los posibles instrumentos Z. 220
Anlisis de datos a
SARRIKO-ON 04/10
Hay que notar que, si l = K, entonces (X Z) y (Z X) son cuadradas y (X Z(Z Z)1 Z X)1 = (Z X)1 Z Z(X Z)1 por lo que en ese caso: M C2E = (Z X)1 Z Z(X Z)1 X Z(Z Z)1 Z Y = (Z X)1 Z Y Para estimar la matriz de varianzas y covarianzas asinttica de M C2E se utiliza el estimador o consistente: (Y X M C2E ) (Y X M C2E ) V (M C2E ) = (X X)1 T
221
SARRIKO-ON 04/10
Anlisis de datos a
222
Tema 5
Modelos Dinmicos a
Clases Magistrales
Habitualmente se dedican a este tema tres clases magistrales. El alumno tiene los instrumentos necesarios para abordar este tema sin dicultad, aunque es un tema en el que se debe de tener una buena visin de conjunto, tanto en trminos de modelizacin con datos en el tiempo, como o e o de estimacin por diversos mtodos. En una primera clase magistral se introduce el tema y el o e profesor ilustra al alumno lo que se entiende por un modelo dinmico distinguiendo entre diversas a especicaciones. Se considera la especicacin dinmica solamente en la parte sistemtica teniendo o a a como variables explicativas retardos de variables exgenas o incorreladas con el trmino de error, o e para ampliar seguidamente con retardos de la variable endgena. Ms adelante se combina con o a dinmica a travs del trmino de error. Las dos clases siguientes se dedican a ilustrar los contenidos a e e del tema con un ejemplo sobre la inuencia de la exencin scal en la tasa de fertilidad usando datos o histricos para EE.UU. Se parte de una especicacin esttica y se va reespecicando el modelo hacia o o a distintas formas de introducir dinmica. De esta forma, el alumno recorre todos los casos propuestos a en la primera clase y se da una visin de conjunto revisando la utilizacin del anlisis grco de las o o a a series utilizadas en el modelo y de los residuos, los contrastes de autocorrelacin vistos en el tema de o autocorrelacin, as como diversos mtodos de estimacin MCO, VI y MCGF haciendo hincapi en o e o e los problemas espec cos que surgen en estos modelos. Se analizan cuestiones de multicolinealidad, sesgo de estimacin por MCO en modelos con retardos de la variable endgena como regresor y o o autocorrelacin y las posibles alternativas para solventar en su caso estos problemas. o A lo largo de las clases magistrales se pedir al alumno, adems de la lectura de las notas sobre a a el tema, la realizacin de diversos ejercicios que se resolvern en clase. Para conocer el grado de o a seguimiento del alumno, se podrn realizar en clase preguntas cortas a resolver. a Competencias a trabajar en estas sesiones. 1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas 223
SARRIKO-ON 04/10 de las variables econmicas de inters para obtener resultados ables. o e Al nal de este tema deber ais ser capaces de 1. Explicar que se entiende por dinmica en un modelo economtrico. a e
Anlisis de datos a
2. Saber analizar grcamente series en el tiempo, tanto la serie observada y ajustada como la a de los residuos MCO. 3. Utilizar el contraste de Breusch-Godfrey para contrastar la posible existencia de autocorrelacin y saber cuando no es adecuado el contraste de Durbin-Watson. o 4. Describir y comparar las propiedades de los estimadores MCO, VI y MCGF en diversas especicaciones dinmicas. a 5. Estimar y hacer inferencia. 6. Saber valorar los resultados obtenidos y elegir los ms adecuados. a Bibliograf Recomendada. Al nal del tema tenis recogida la bibliograf correspondiente. En a e a particular os recomendamos leer los cap tulos correspondientes a la bibliograf bsica detallados a a a continuacin: o Greene, W. (1998), cap. 17 Ramanathan, R. (2002), cap. 6 y 10 Wooldridge, J.M. (2003), cap. 15 y 18 Y para profundizar, podis leer los cap e tulos detallados a continuacin correspondientes a la biblioo graf complementaria: a Alonso, A. y otros (2005), cap. 11 Gujarati, D. (2004), cap. 17 Johnston, J. (1984), cap. 9 y 10 Novales, A. (1993), cap. 9 Pindyck R. S. y Rubinfeld, D.L. (1998), cap. 14
224
Anlisis de datos a
SARRIKO-ON 04/10
5.1.
Introduccin o
Este tema vuelve a ocuparse de la modelizacin de relaciones entre variables dentro de un contexto o de datos en el tiempo o series temporales. Como ya comentamos en el tema de autocorrelacin, estos o datos presentan un ordenamiento natural, ya que las observaciones estn ordenadas de acuerdo al a momento del tiempo en que han sido observadas. A su vez, ser probable que a la hora de explicar el comportamiento de una variable observada en el a tiempo, se tenga en cuenta que bien su propio pasado pueda ser relevante en periodos sucesivos, o bien que el efecto de una variable explicativa no sea slo contemporneo sino que puede tener efectos o a distribuidos en aos sucesivos. Finalmente, adems se pueden tener factores no observables recogidos n a en el trmino de perturbacin del modelo cuya inuencia se mantiene a lo largo del tiempo. De esa e o ultima parte ya nos ocupamos en el tema de autocorrelacin. En este nuevo tema trataremos de o estudiar la manera de recoger, en un modelo de regresin lineal, estos efectos temporales o dinmicos o a en la parte que llamamos sistemtica, o de factores observables, y su posible interaccin con el tema a o de autocorrelacin, que ya de por s introduce dinmica en el error, donde se recogen efectos o o a variables no observables. Primeramente nos ocuparemos de ver distintas especicaciones y en cada caso se comentarn los problemas que pueden surgir en la estimacin por el mtodo de M a o e nimos Cuadrados Ordinarios. Si hay mtodos alternativos a MCO tambin se discutir su utilizacin y e e a o propiedades. Por ultimo, nos ocuparemos de un ejemplo emp rico que nos llevar por diferentes especicaciones: a desde un modelo esttico donde se especica una relacin contempornea entre la tasa de fertilidad a o a anual en EE.UU. en el siglo XX y las exenciones scales en ese ao, hacia diferentes especicaciones n ms generales donde se introduce expl a citamente la modelizacin dinmica en todas sus fuentes. o a Este ejemplo tambin ser la base para las prcticas de ordenador. De esta forma, lo estudiado en e a a las clases magistrales se reforzarn a la hora de obtener los resultados en el centro de clculo. a a
5.2.
Especicacin y estimacin de modelos dinmicos o o a
En el contexto del modelo de regresin lineal general, las relaciones dinmicas entre la variable o a dependiente y las variables explicativas se pueden introducir de diversas maneras:
5.2.1.
Dinmica solamente en la parte sistemtica a a
Entendemos por parte sistemtica del modelo a aquella que contiene las variables explicativas obsera vables o regresores del modelo. Se pueden considerar dos tipos de regresores: retardos de la variable dependiente o endgena que son regresores estocsticos, y por otro lado retardos de las variables o a consideradas jas o exgenas, esto es, que en ningn caso estn correlacionadas con el trmino de o u a e error del modelo e incluso se pueden considerar independientes de ste. En el modelo podemos tener e solamente un tipo de cada uno o tambin una mezcla, pero sus caracter e sticas diferentes hacen que tengamos que ser cautelosos a la hora de estudiar el tipo de problemas que pueden introducir a la hora de la estimacin e inferencia. o 225
SARRIKO-ON 04/10 Modelos con variables no estocsticas o exgenas retardadas a o
Anlisis de datos a
La formulacin general del modelo, para el caso de una sola variable exgena Xt o regresor jo, es: o o Yt = 1 + 2 Xt + 3 Xt1 + 4 Xt2 + . . . + m+1 Xtm + ut Este tipo de modelos recibe el nombre de modelo de retardos distribuidos nitos. Si ut iid(0, 2 ) y los regresores son variables no estocsticas, el estimador MCO es lineal, insesgado a y eciente. El problema que puede surgir es la poca precisin en la estimacin de los efectos indivio o duales de la variable Xt y sus retardos, ya que el grado de multicolinealidad entre estos regresores puede ser muy alto. Esto es debido a que las series temporales econmicas suelen presentar cambios o lentos de un per odo a otro. Por otro lado, cuantos ms retardos introduzcamos ms coecientes a a tendremos que estimar a la vez que dispondremos de menos observaciones, por lo que existe una disminucin por ambos lados de los grados de libertad. o Aqu surge otro problema ya que el nmero de retardos a introducir tal que el error sea ruido blanco u puede ser elevado. Por lo tanto, la inferencia para poder determinar qu retardos son relevantes o e cuantos introducir en el modelo desde el inicio de la especicacin puede verse afectada por este o problema de multicolinealidad, agravado por tener pocos grados de libertad. Este es un problema de dif solucin, a no ser que se imponga cierta estructura ad-hoc o restricciones en los coecientes cil o reduciendo el nmero de parmetros a estimar. u a Modelos con variable endgena retardada o Si el modelo incluye entre sus variables explicativas retardos de la variable endgena, se deja de o cumplir el supuesto de regresores no estocsticos. La matriz de datos X es estocstica, ya que los rea a gresores que son retardos de la variable dependiente Yt1 , Yt2 , , Yts , son variables aleatorias que vienen determinados por los trminos de perturbacin ut1 , ut2 , , uts , . . .. Nos encontramos, e o por lo tanto, en el caso de regresores estocsticos y es preciso hacer supuestos sobre la distribucin a o conjunta de X y u. Ejemplo 5.11 En el modelo: Yt = 1 + 2 Xt + 3 Yt1 + ut (5.2) (5.1)
El supuesto de que la matriz X sea independiente del vector u signica que tanto Xt como Yt1 han de ser independientes de todos los valores pasados, presentes y futuros de la perturbacin. o El modelo (5.2) implica que el regresor Yt1 est relacionado con ut1 , ut2 , . . ., por lo que este a supuesto no se cumple. Luego implica que el estimador MCO es un estimador sesgado y no se conoce su distribucin exacta para un tamao de muestra dado. o n Sin embargo, si el trmino de perturbacin es un ruido blanco ut iid(0, 2 ), entonces Yt1 no e o est correlacionado con ut . Es decir, se cumple que E(Yt1 ut ) = 0, lo que signica que nos encona tramos en el caso de un modelo con regresores estocsticos que no estn correlacionados contema a porneamente con la perturbacin, por lo que, como vimos en el tema de Regresores Estocsticos, a o a los estimadores MCO son consistentes y tienen distribucin asinttica Normal. o o 226
Anlisis de datos a
SARRIKO-ON 04/10
Por lo tanto, los modelos dinmicos con variable endgena retardada y perturbaciones bien compora o tadas se pueden estimar por MCO, conservando estos estimadores sus buenas propiedades asintticas o y siendo vlidos asintticamente los resultados habituales de inferencia estad a o stica.
5.2.2.
Dinmica en la parte sistemtica y en la perturbacin a a o
Consideremos los modelos anteriores pero aadamos que tenemos evidencia de autocorrelacin en el n o trmino de perturbacin. En general para contrastar la existencia de autocorrelacin en el trmino de e o o e perturbacin en modelos con retardos de variables explicativas, se pueden utilizar tanto el contraste o de Durbin-Watson como el de Breusch-Godfrey. Ahora bien, el test de Durbin-Watson no es aplicable cuando en el modelo la variable endgena retardada aparece como regresor. En ese caso el estad o stico est sesgado hacia valores que indican ausencia de autocorrelacin. Adems las cotas de valores a o a cr ticos tampoco son vlidas. Luego, en este caso utilizaremos el contraste de Breusch-Godfrey que a sigue siendo vlido. a El hecho de tener autocorrelacin en el error introduce diferentes implicaciones en las propiedades o del estimador MCO al tener solamente retardos de variables exgenas o regresores no estocsticos o a o tener tambin retardos de la variable endgena. Por eso los trataremos por separado. e o Ejemplo 5.12 Modelos con variables jas o exgenas retardadas y autocorrelacin o o
Por ejemplo, consideremos el modelo: Yt = 1 + 2 Xt + 3 Xt1 + 4 Xt2 + ut ut = ut1 + t

2 t iid(0, )
(5.3)
En este caso se combinan los problemas comentados anteriormente debido a la posible multicolinealidad entre los regresores y el problema de autocorrelacin, teniendo ambos como consecuencia falta o de precisin en la estimacin por MCO. Adems, como ya hemos comentado en temas anteriores, o o a al existir autocorrelacin los estad o sticos t y F calculados con el estimador habitual de la matriz de varianzas y covarianzas V (M CO ) = 2 (X X)1 no son ables. La estimacin por MCG, o por MCGF si no es conocido, ser ms eciente que MCO, al menos o a a asintticamente, y la inferencia sobre los coecientes basados en estos mtodos ser vlida. Pero el o e a a problema de la multicolinealidad y sus efectos sobre la precisin en las estimaciones de los coecientes o individuales por estos mtodos persiste. e Ejemplo 5.13 Modelos con variable endgena retardada y autocorrelacin o o
Supongamos por ejemplo el modelo: Yt = 1 + 2 Xt + 3 Yt1 + ut (5.4)
donde Xt es un regresor no estocstico y ut no es un ruido blanco, sino que presenta autocorrelacin, a o bien un proceso AR(p) o MA(q). La existencia de autocorrelacin en las perturbaciones hace que Yt1 est relacionada con ut meo e diante la funcin de regresin y ut est correlacionado con ut1 debido a la autocorrelacin de al o o a o 227
SARRIKO-ON 04/10
Anlisis de datos a
menos orden uno en las perturbaciones. Por lo que, por ejemplo en el caso del modelo (5.4) si ut sigue un AR(1): E(Yt1 ut ) = E (1 + 2 Xt1 + 3 Yt2 + ut1 ) (ut1 + t ) = 0 Estamos en el caso de regresores estocsticos correlacionados con el trmino de perturbacin del a e o modelo que tratamos en el tema de Regresores Estocsticos. En esta situacin se demostr que los a o o estimadores MCO de los parmetros del modelo no son consistentes, perdiendo as tanto las buenas a propiedades para muestra nitas como asintticas. Para obtener estimadores consistentes de los o parmetros del modelo (5.4) podemos aplicar los siguientes mtodos: a e Estimador de variables instrumentales. En el modelo (5.4) slo o hemos de encontrar un instrumento para Yt1 porque la variable Xt no plantea problemas al ser una variable exgena o regresor no estocstico para todo t. Por esa razn, un instrumento o a o podr ser la variable Xt1 , que cumple las condiciones de no estar correlacionada con ut y a s con Yt1 a travs del propio modelo. La matriz Z de instrumentos, en este caso, puede ser e la siguiente: 1 X2 X1 1 X3 X2 = . Z . . . . . . . .
((T 1)3)
1 XT siendo X
((T 1)3)
XT 1
1 X2 1 X3 . . . . . . 1 XT
Y1 Y2 . . . YT 1
; Y
((T 1)1)
Y2 Y3 . . . YT
Al no estar Xt1 como regresor en el modelo, el rango de la matriz (Z X) es completo e igual a 3, por lo que al existir su inversa, el estimador de VI est bien denido como: a V I = (Z X)1 Z Y V I = T 1
T t=2 Xt T t=2 Xt1 T t=2 Xt T 2 t=2 Xt T t=2 Xt1 Xt T t=2 Yt1 T t=2 Xt Yt1 T t=2 Xt1 Yt
T t=2 Yt T t=2 Xt Yt T t=2 Xt1 Yt
Ahora bien, este estimador, aunque consistente, no es asintticamente eciente. Adems, al o a existir autocorrelacin en el trmino de error, la distribucin asinttica derivada en el tema o e o o de regresores estocsticos utilizando el teorema de Mann-Wald no es la adecuada en este caso. a 228
Anlisis de datos a
SARRIKO-ON 04/10
Por lo tanto, hay que ser cuidadosos a la hora de computar adecuadamente las desviaciones t picas para realizar los contrastes utilizando este estimador. Una opcin alternativa, pero que puede requerir de este estimador como una primera etapa, es o utilizar la estimacin obtenida por el mtodo de M o e nimos Cuadrados Generalizados Factibles. Estimador de M nimos Cuadrados Generalizados Factibles. Si la perturbacin del o modelo (5.4) sigue un AR(1), el modelo transformado que cumple las hiptesis bsicas conocido o a el valor de , para t = 3, . . . , T es: Yt Yt1 = 1 (1 ) + 2 (Xt Xt1 ) + 3 (Yt1 Yt2 ) + t (5.5)
El trmino de error de este modelo, t , es un ruido blanco, por lo que aunque los regresores e (Yt1 Yt2 ) son estocsticos y no son independientes de t , estn contemporneamente a a a incorrelacionadas, E[(Yt1 Yt2 ), t ] = 0, t. As tanto el mtodo de Hildreth-Lu como el de Cochrane-Orcutt, son procesos iterativos que , e se basan en, dado un valor de , minimizar respecto a la funcin: o SCR() =
T t=3
(Yt Yt1 ) 1 (1 ) 2 (Xt Xt1 ) 3 (Yt1 Yt2 )
(5.6)
La cuestin relevante es cmo jar el valor de para que el estimador de as obtenido sea o o consistente y asintticamente eciente. En el caso de el mtodo de Hildreth-Lu no hay probleo e ma porque la estimacin de se hace en funcin de una red de valores para este parmetro o o a en el intervalo (1, 1) tal que se elige aqul asociado con el menor valor en la red calculada e como SCR() en (5.6). En el caso del mtodo de Cochrane-Orcutt no es adecuado obtener un estimador de bae sado en los residuos de estimar los coecientes del modelo (5.4) por MCO, ya que ste e no es consistente. El proceso se puede iniciar, por ejemplo, calculando los residuos partiendo del estimador por Variables Instrumentales, V I , de los coecientes del modelo (5.4). As , calcular amos el estimador inicial de como: =
T t=2 uV I,t uV I,t1 T 2 t=2 uV I,t1
donde uV I,t = Yt 1,V I + 2,V I Xt + 3,V I Yt1 t = 2, . . . , T . Posteriormente proceder amos que la de igual forma, sustituyendo ese valor en la funcin (5.6) y obtendr o amos el valor de minimiza, que ser el obtenido de la regresin en el modelo transformado con ese valor de . a o El estimador as obtenido en esta segunda etapa es consistente y asintticamente eciente. El o procedimiento puede iterarse comenzando con este estimador de para volver a obtener los residuos y as sucesivamente. Asintticamente, no se mejora en eciencia si iteramos. o 229
SARRIKO-ON 04/10
Anlisis de datos a
5.3.
Ejemplo magistral: hacia una modelizacin dinmica o a
En un estudio sobre la pol tica de natalidad del gobierno de EE.UU. en el siglo XX, los autores disponen de datos anuales sobre las siguientes variables1 , para el per odo 1913-1984: gfr: pe : year : pill : ww2 : tasa general de fertilidad2 . valor real en dlares de la exencin en el pago de impuestos personales. o o tendencia temporal t=1,...,72 (de 1913 a 1984). variable cticia igual a 1 en el ao de introduccin de la p n o ldora 1963. variable cticia igual a 1 si el ao est entre 1941 y 1945 (2a guerra mundial) n a
La cuestin principal del estudio es analizar si, en el agregado, la decisin de tener hijos est relao o a cionada con el valor impositivo de tener un hijo. Inicialmente se especica un modelo en el que para explicar la tasa de fertilidad en un ao concreto solamente se considera como variable explicativa n las exenciones scales en ese ao. n gfrt = 1 + 2 pet + ut (5.7) Por lo tanto, dado que las variables dependiente y explicativa estn en el mismo periodo de tiempo, a el efecto de una variacin en la reduccin scal sobre el nmero de nacimientos se supone que, de o o u tener relevancia, es en el mismo ao o de forma contempornea. Si se supone que el trmino de pern a e turbacin no est correlacionado en el tiempo, el modelo de partida no es un modelo dinmico sino o a a esttico. Esta especicacin de partida puede no ser la ms adecuada, bien porque para analizar el a o a efecto de las exenciones scales sobre la tasa de fertilidad se ha de controlar por otros factores que pueden afectar bien en el mismo periodo, de forma contempornea, o bien en periodos consecutivos. a Adems, la propia tasa de fertilidad puede presentar cierta dependencia o correlacin en el tiempo, a o tal que pueda ser relevante su propio pasado como variable explicativa. A su vez, pudiera ocurrir que hubiera factores no observables recogidos en el trmino de perturbacin que presentaran correlacin e o o en el tiempo. De todo ello nos iremos ocupando de forma escalonada, tratando de encontrar una especicacin adecuada. o Comencemos pues con esta primera especicacin, para la cual consideramos el siguiente anlisis: o a Del estudio de los grcos de la evolucin temporal de ambas variables podemos concluir que: la a o serie temporal de la tasa de fertilidad presenta un ciclo con una ca continuada en el periodo de da 1913 a 1936 y una recuperacin progresiva a partir de esa fecha hasta 1957, ao donde se alcanza o n casi la misma tasa que al comienzo de la muestra. A partir de 1957 vuelve a darse una ca en la da tasa de fertilidad, no mostrando seales de recuperacin en lo aos posteriores hasta el nal de la n o n muestra. Por otro lado, podemos apreciar que las exenciones scales experimentaron un crecimiento muy importante entre los aos 1940-1945, per n odo de la 2a guerra mundial, para luego descender, primero de forma abrupta hasta el ao 1950 y posteriormente, de forma progresiva, a partir de ese ao hasta n n el nal de la muestra.
1 Fichero fertil3.gdt, disponible en gretl pestaa Wooldridge. Fuente: Wooldridge, J.M. (2001), Introduccin a la n o Econometr a.
230
Anlisis de datos a
SARRIKO-ON 04/10
Figura 5.1: Grcos de las series de fertilidad y de las exenciones scales a

130 250
120 200 110
Nacimientos
150 Deduccion 100 50 70 0 1920 1930 1940 1950 1960 1970 1980 1920 1930 1940 1950 1960 1970 1980 100
90
80
60
Analicemos los primeros resultados obtenidos de la estimacin del modelo (5.7) o Estimaciones MCO utilizando las 72 observaciones 19131984 Variable dependiente: gfr Variable const pe Coeciente 96,344300 0,007095 Desv. t pica 4,30473 0,03592 Estad stico t 22,3810 0,1975 95,63190 19,80460 27832,4 19,94000 0,00055 0,01372 70 0,04691 0,97791 valor p 0,0000 0,8440
Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de los residuos ( ) R2 R2 corregido Grados de libertad Estad stico de DurbinWatson Coef. de autocorr. de primer orden.
El valor del coeciente de determinacin R2 = 0, 000556 indica que el ajuste es muy pobre. Las o exenciones scales no explican por si solas casi nada de la tasa de fertilidad en ese mismo ao. n Esto tambin se ve reejado en la no signicatividad del coeciente de regresin, ya que el valor e o p asociado al valor muestral del estad stico t, 0,844, es mucho mayor que el nivel de signicacin o = 0, 05. El contraste de autocorrelacin con el estad o stico de Durbin-Watson indica que en el modelo (5.7) la perturbacin est autocorrelada ya que DW = 0, 046 < 1, 58 = dL , la cota inferior o a obtenida para T = 72 y K = 3. Los grcos de residuos, Figura 5.2, y de la serie observada y ajustada por el modelo, Figura 5.3, a indican que el ajuste ha dejado sin explicar toda la evolucin temporal de la tasa de fertilidad, o y simplemente ha recogido un nivel aproximadamente igual a la media de esta tasa en el periodo muestral. Todos estos elementos llaman a incluir otras variables explicativas en el modelo. 231
SARRIKO-ON 04/10
Anlisis de datos a
Figura 5.2: Grco de residuos MCO a

Residuos de la regresin (= gfr observada estimada) 40
30
20
10 residuo
10
20
30
40 1920 1930 1940 1950 1960 1970 1980
Figura 5.3: Grco de la serie gfr observada y ajustada a

gfr observada y estimada 130 estimada observada 120
110
100 gfr 90 80 70 60 1920 1930 1940 1950 1960 1970 1980
Consideramos incluir dos variables cticias, ww2 y pill, que tienen en cuenta un posible cambio en el valor medio de la tasa de fertilidad durante el periodo de la segunda guerra mundial y a partir de la introduccin de la p o ldora como mtodo anticonceptivo, respectivamente. La especicacin sigue e o siendo la de un modelo esttico, ya que no introducimos valores retardados de ninguna variable. El a modelo a estimar entonces es el siguiente: gfrt = 1 + 2 pet + 3 pillt + 4 ww2t + ut y los resultados de la estimacin se muestran a continuacin: o o 232 (5.8)
Anlisis de datos a
SARRIKO-ON 04/10 Estimaciones MCO utilizando las 72 observaciones 19131984 Variable dependiente: gfr
Variable const pe pill ww2
Coeciente 98,6818 0,0825 31,5940 24,2380
Desv. t pica 3,20813 0,02964 4,08107 7,45825
Estad stico t 30,7599 2,7842 7,7416 3,2499 95,6319 19,8046 14664,3 14,6851 0,4734 0,4501 20,3780 0,1768 0,8904
valor p 0,0000 0,0069 0,0000 0,0018
Media de la var. dependiente D.T. de la variable dependiente Suma de cuadrados de los residuos Desviacin t o pica de los residuos ( ) R2 R2 corregido F (3, 68) Estad stico de DurbinWatson Coef. de autocorr. de primer orden.
Las dos variables cticias presentan coecientes estimados negativos y son signicativas individualmente, indicando que parece existir una ca signicativa en media en la tasa de fertilidad, tanto da durante el periodo de la 2a guerra mundial, como despus de la introduccin de la p e o ldora. A su vez, las exenciones scales presentan un coeciente estimado positivo siendo su efecto sobre la tasa de fertilidad signicativo al menos de forma contempornea, ya que el valor p asociado a su coeciente a igual a 0, 0069 es menor que el nivel de signicacin tanto del 0, 05 como del 0, 01. En trminos de o e bondad de ajuste se ha mejorado sustancialmente tanto en trminos del coeciente de determinacin e o 2 como del corregido. El ajuste explica un 47 % de la variabilidad de la tasa de fertilidad en la R muestra. Viendo los grcos de la serie observada y ajustada junto con el de los residuos, Figura 5.4, se observa a que el ajuste no es bueno, especialmente en el periodo inicial de 1913 a 1940. En este periodo la tasa de fertilidad observada disminuye progresivamente mientras que la ajustada se mantiene constante. Por este motivo, el grco de los residuos muestra una agrupacin de residuos consecutivos del a o mismo signo que sugiere la posible existencia, tambin en esta segunda especicacin del modelo, e o de autocorrelacin al menos de orden uno positiva. El valor del estad o stico de Durbin y Watson igual a 0, 176 es menor que el valor de la cota inferior dL = 1, 52 para T = 72 y K = 3. Esto conrma la sospecha, ya que se rechaza la hiptesis nula de no autocorrelacin frente a un proceso o o AR(1) con coeciente positivo en la perturbacin del modelo. o La cuestin est ahora en si la dinmica en la tasa de fertilidad es algo a recoger unicamente por o a a el trmino de error o bien existe un problema de mala especicacin tal que se necesita introducir e o retardos de alguna variable, bien pe, bien gf r o ambas. Dado que hay autocorrelacin en el error, para que la inferencia utilizando el estimador MCO o de los coecientes sea vlida, tenemos que estimar de forma consistente la matriz de varianzas a y covarianzas de los coecientes estimados por MCO. Estos ser los resultados utilizando un an estimador de la matriz de varianzas y covarianzas de los coecientes estimados robusto a la existencia 233
SARRIKO-ON 04/10
Anlisis de datos a
Figura 5.4: Grco de residuos MCO y de la serie gfr observada y ajustada a

Residuos de la regresin (= gfr observada estimada) 30
20
10
residuo
10
20
30 1920 1930 1940 1950 1960 1970 1980
gfr observada y estimada 130 estimada observada 120
110
100 gfr 90 80 70 60 1920 1930 1940 1950 1960 1970 1980
de autocorrelacin: o Estimaciones MCO utilizando las 72 observaciones 19131984 Variable dependiente: gfr Desviaciones t picas robustas a autocorrelacin o Variable const pe pill ww2 Coeciente 98,6818 0,0825 31,5940 24,2380 Desv. t pica 7,69679 0,04772 5,43135 3,55876 234 Estad stico t 12,8212 1,7294 5,8170 6,8109 valor p 0,0000 0,0883 0,0000 0,0000
Anlisis de datos a
SARRIKO-ON 04/10
De esta forma podemos hacer los contrastes de signicatividad individual con los valores de los estad sticos t que nos muestra el output eligiendo el valor cr tico en la distribucin N(0,1). El valor o cr tico de la N(0,1) para un contraste a dos colas al nivel de signicacin del 5 % es 1,96 luego las o variables pill y ww2 son individualmente signicativas. En cambio las ayudas scales dejan de serlo al 5 %, aunque an lo ser al 10 % de signicacin. u an o Si el problema de autocorrelacin detectado es debido a la existencia de un proceso AR(1) en la o perturbacin, ut = ut1 + t , el modelo deber ser estimado por MCGF, bien Cochrane-Orcutt o o a Hildreth-Lu. Utilizamos el mtodo de Cochrane-Orcutt y obtenemos los siguientes resultados: e Estimaciones por CochraneOrcutt, usando las observaciones 19141984 (T = 71) Variable dependiente: gfr = 0,976137 Coeciente const pe pill ww2 66,8660 0,0159 3,4131 5,4514 Desv. T pica 21,5987 0,0318 4,2129 3,3389 Estad stico t 3,0958 0,5028 0,8101 1,6327 Valor p 0,0029 0,6168 0,4207 0,1072
La estimacin del coeciente es muy cercana a la unidad, = 0,976137, lo que indica una alta o persistencia en la serie de los residuos, tardan en cambiar el signo. Los estad sticos de signicatividad individual muestran que ninguna de las variables explicativas es signicativa. Este resultado es bastante llamativo. Adems el coeciente que acompaa a la variable pe es de signo contrario al a n esperado. Parece que esa alta persistencia en la serie de los residuos puede estar afectando a estos resultados. La evidencia existente de autocorrelacin en el modelo anterior llama a considerar otras especio caciones alternativas donde se tenga en cuenta caracter sticas en el tiempo de la serie a explicar, como pueden ser tendencias, dependencia en el tiempo de la propia serie o efectos distribuidos en el tiempo de la exencin scal sobre la tasa de fertilidad. o Especicaciones alternativas: A. Modelizacin de tendencias aadiendo al modelo una tendencia temporal lineal, t, o cuadrtica, o n a 2. t En la Figura 5.1 se observa que la serie gf r o tasa de fertilidad presenta una ca continuada da en todo el periodo muestral a excepcin de los aos 1936-1957. Viendo el grco de la serie gfr o n a observada y ajustada, Figura 5.4, esta tendencia decreciente parece que no est bien recogida a por la especicacin (5.8). Esta puede ser una de las causas de detectar autocorrelacin positiva o o en el error. Una forma de recoger esta tendencia es incluir como regresor la variable t, tiempo o tendencia temporal; luego t = 1, 2, . . . , 72. Esta variable puede recoger parte de la inuencia de factores no observables que estn creciendo o decreciendo sistemticamente en el tiempo. a a gfrt = 1 + 2 t + 3 pet + 4 pillt + 5 ww2t + ut 235 (5.9)
SARRIKO-ON 04/10
Anlisis de datos a
Estimaciones MCO, usando las observaciones 19131984 (T = 72) Variable dependiente: gfr Coeciente const t pe pill ww2 111,7690 1,1498 0,2788 0,9974 35,5923 Desv. T pica 3,35777 0,18790 0,04001 6,26163 6,29738 Estad stico t 33,2868 6,1195 6,9685 0,1593 5,6519 Valor p 0,0000 0,0000 0,0000 0,8739 0,0000 0,642047 3,76e15 0,350212
R2 F (4, 67)
0,662213 32,83745 0,819265
R2 corregido Valor p (de F ) DurbinWatson
Figura 5.5: Grcos de residuos y de la serie gfr observada y ajustada a

Residuos de la regresin (= gfr observada estimada) 20 15 10 5 100 residuo 0 gfr 90 80 10 15 20 25 1920 1930 1940 1950 1960 1970 1980 70 60 50 1920 1930 1940 1950 1960 1970 1980 5 130 120 110 estimada observada gfr observada y estimada
Vemos en los resultados de la estimacin por MCO de esta especicacin (5.9) que el ajuste o o ha mejorado, tanto en trminos del coeciente de determinacin corregido como grcamente, e o a en el grco de la serie gf r observada y ajustada, Figura (5.5.) La tendencia t es una variable a signicativa y el coeciente estimado es negativo, recogiendo que la tasa de fertilidad gf r est descendiendo, en media, a lo largo del per a odo muestral, manteniendo el resto de variables jo. Por otro lado, el coeciente de la variable pe se ha triplicado en relacin al estimado en el o modelo (5.8) y es signicativo. En cambio la variable que recoge el efecto de la introduccin o de la p ldora anticonceptiva pill no es signicativa. De todas formas, hay que ser cautos con estos resultados de signicatividad dado que el estad stico de Durbin-Watson toma un valor menor que el valor de la cota inferior obtenida para T = 72 y K = 4 DW = 0, 350212 < dL = 1, 5029 indicando evidencia de autocorrelacin positiva en el trmino de perturbacin de esta o e o especicacin. Dada la existencia de autocorrelacin, los contrastes realizados en base a los o o resultados de la estimacin MCO no son vlidos para realizar inferencia. o a Si tenemos en cuenta una estimacin robusta a autocorrelacin de las desviaciones t o o picas para realizar los contrastes de signicatividad con las estimaciones por MCO de los coecientes, las 236
Anlisis de datos a
SARRIKO-ON 04/10
conclusiones no cambian. No mejoramos en cuanto a signicatividad ni en cuanto a los signos de los coecientes estimados. Estimaciones MCO, usando las observaciones 19131984 (T = 72) Variable dependiente: gfr Desviaciones t picas robustas a autocorrelacin o Coeciente const t pe pill ww2 111,7690 1,1498 0,2788 0,9974 35,5923 Desv. T pica 5,8204 0,3226 0,0713 10,7323 7,5391 Estad stico t 19,2027 3,5643 3,9077 0,0929 4,7210 Valor p 0,0000 0,0007 0,0002 0,9262 0,0000
As y todo, vemos que la tasa de fertilidad tambin presenta un periodo, de 1936 a 1947, de e tendencia creciente, por lo que podemos considerar ver qu ocurre si incluimos tambin una e e tendencia cuadrtica, tsq t2 . El modelo a estimar en este caso ser entonces: a a gfrt = 1 + 2 t + 3 t2 + 4 pet + 5 pillt + 6 ww2t + ut y los resultados de la estimacin son los siguientes: o Estimaciones MCO, usando las observaciones 19131984 (T = 72) Variable dependiente: gfr Coeciente const t tsq pe ww2 pill 124,0920 2,5314 0,0196 0,3478 35,8803 10,1197 Desv. T pica 4,36074 0,38938 0,00497 0,04025 5,70792 6,33600 Estad stico t 28,4566 6,5011 3,9454 8,6392 6,2861 1,5972 Valor p 0,0000 0,0000 0,0002 0,0000 0,0000 0,1150 0,705970 2,44e17 0,514369 (5.10)
R2 F (5, 66)
0,726676 35,09434 0,742433
Los dos coecientes de tendencia son signicativos y, como era de esperar, de signo contrario; el coeciente que acompaa a t es negativo, indicando la tendencia decreciente en promedio de la n tasa de fertilidad, y el que acompaa a t2 es positiva, recogiendo el hecho de que hay periodos n en los que esa tendencia es creciente. El coeciente de pe es incluso mayor cuantitativamente que antes, y estad sticamente signicativo. Ahora el coeciente estimado que acompaa a la n variable pill tiene el signo esperado negativo pero sigue sin ser signicativo. De todas formas, sigue existiendo evidencia de autocorrelacin positiva3 , ya que DW = 0, 514369 es menor que o la cota inferior dL = 1, 4732 para T = 72 y K = 5.
Una posibilidad es incluir ms elementos de tendencia t3 , t4 . . . tal que se llegar a ajustar perfectamente la serie. a a Pero el inters en el anlisis de regresin es capturar movimientos tendenciales generales de la serie a explicar con el e a o objetivo de descubrir cules son las variables explicativas que afectan a gf r. a
3
237
SARRIKO-ON 04/10
Anlisis de datos a
Figura 5.6: Grco de residuos MCO y de la serie gfr observada y ajustada a

Residuos de la regresin (= gfr observada estimada) 20 15 120 10 5 0 residuo 5 10 15 20 70 25 30 1920 1930 1940 1950 1960 1970 1980 60 1920 1930 1940 1950 1960 1970 1980 gfr 110 130 estimada observada gfr observada y estimada
100
90
80
Teniendo en cuenta la autocorrelacin a la hora de estimar la matriz de varianzas y covarianzas o del estimador MCO, los resultados de signicatividad no cambian sustancialmente. Estimaciones MCO, usando las observaciones 19131984 (T = 72) Variable dependiente: gfr Desviaciones t picas robustas a autocorrelacin o Coeciente const t tsq pe pill ww2 124,0920 2,5314 0,0196 0,3478 10,1197 35,8803 Desv. T pica 4,88820 0,62030 0,00744 0,08289 11,49250 9,02103 Estad stico t 25,3860 4,0809 2,6330 4,1956 0,8805 3,9774 Valor p 0,0000 0,0001 0,0105 0,0001 0,3818 0,0002
Las especicaciones anteriores consideran un modelo con autocorrelacin en la perturbacin o o que no parece ser adecuadamente recogida en media, incluso cuando incluimos una tendencia lineal y/o cuadrtica. Por ello, parece sensato intentar una especicacin del modelo donde a o incorporemos expl citamente dinmica en la parte sistemtica. a a B. Modelizaciones dinmicas: Incorporacin de retardos de la variable endgena gf r o/y de la a o o variable explicativa pe. Primeramente especicamos un modelo de retardos distribuidos incluyendo como regresores cuatro retardos consecutivos de la variable pe t , es decir, aadimos pe t1 , ..., pe t4 a la lista n de regresores del modelo 5.8. La especicacin ser la siguiente: o a
gfrt = 1 + 2 pet + 3 pet1 + 4 pet2 + 5 pet3 + 6 pet4 + 7 pillt + 8 ww2t + ut (5.11) Los resultados de la estimacin por MCO se muestran a continuacin: o o 238
Anlisis de datos a
SARRIKO-ON 04/10 Estimaciones MCO, usando las observaciones 19171984 (T = 68) Variable dependiente: gfr Coeciente const pe pe 1 pe 2 pe 3 pe 4 pill ww2 92,5016 0,0887 0,0039 0,0073 0,0180 0,0139 31,0816 21,3435 Desv. T pica 3,32548 0,12618 0,15311 0,16510 0,15358 0,10502 3,89687 11,54080 Estad stico t 27,8160 0,7033 0,0260 0,0448 0,1177 0,1327 7,9761 1,8494 Valor p 0,0000 0,4846 0,9794 0,9644 0,9067 0,8948 0,0000 0,0693 0,482772 3,63e08 0,215806
R2 F (7, 60)
0,536811 9,933828 0,862026
De partida, hemos perdido cuatro observaciones porque necesitamos ese nmero de condiciones u iniciales para denir los retardos, luego nuestro tamao de muestra disponible es ahora T = 68. n En esta regresin solamente tenemos retardos de la variable exgena pe que consideramos o o regresores no estocsticos. Por lo tanto, si el resto de hiptesis bsicas sobre el trmino de a o a e perturbacin se satisfacen, podremos hacer inferencia vlida en muestras nitas y el estimador o a MCO tendr buenas propiedades, tanto en muestras nitas como asintticas. a o La cuestin es que el valor del estad o stico de Durbin-Watson indica con claridad que hay evidencia de autocorrelacin positiva en el trmino de error, ya que DW = 0, 215806 < 1, 3893 = o e dL obtenida para T = 68 y K = 7. Tenemos que contrastar la signicatividad, individual y conjunta, a travs de estad e sticos vlidos. Para ello, si seguimos utilizando el estimador de los a coecientes por MCO, debemos estimar consistentemente su matriz de varianzas y covarianzas. Los resultados en este caso son los siguientes: Estimaciones MCO, usando las observaciones 19171984 (T = 68) Variable dependiente: gfr Desviaciones t picas robustas a autocorrelacin o Coeciente const pe pe 1 pe 2 pe 3 pe 4 pill ww2 92,5016 0,0887 0,0039 0,0073 0,0180 0,0139 31,0816 21,3435 Desv. T pica 7,35339 0,08820 0,06700 0,08428 0,06640 0,07249 5,07610 10,41060 Estad stico t 12,5794 1,0062 0,0594 0,0877 0,2723 0,1923 6,1231 2,0502 Valor p 0,0000 0,3184 0,9529 0,9304 0,7863 0,8482 0,0000 0,0447 0,482772 7,09e10 0,215806
R2 F (7, 60)
0,536811 12,70587 0,862026
R2 corregido Valor p (de F ) DurbinWatson 239
SARRIKO-ON 04/10 Contraste de omisin de variables o Hiptesis nula: los parmetros son cero para pet1 , pet2 , pet3 , pet4 o a Estad stico de contraste asinttico: o valor muestral del estad stico 2 (4) = 0,392538 con valor p = 0,982663 Contraste de omisin de variables o Hiptesis nula: los parmetros son cero para pet , pet1 , pet2 , pet3 , pet4 o a Estad stico de contraste asinttico: 2 (5) = 12,1584 o con valor p = 0,045022
Anlisis de datos a
Contraste de omisin de variables por eliminacin secuencial o o (nivel de signicacin 0, 05 a dos colas) o Quitando pet1 (valor p 0,953) no se rechaza que ese coeciente sea cero Quitando pet2 (valor p 0,960) no se rechaza que ese coeciente sea cero Quitando pet4 (valor p 0,846) no se rechaza que ese coeciente sea cero Quitando pet3 (valor p 0,605) no se rechaza que ese coeciente sea cero
Introduce esta especicacin algn otro problema conocido? Hay un problema de multicoo u linealidad entre pet y sus retardos pet1 , . . . , pet4 ? Vemos que los coecientes de las variables pet y sus retardos pet1 , , pet4 no son individualmente signicativos. Por otro lado, al realizar el contraste de omisin de variables bajo la o hiptesis nula de que los parmetros son cero para pet , pet1 , pet2 , pet3 , pet4 conjuntamente o a se rechaza esa hiptesis. Por lo tanto, puede existir un problema de multicolinealidad entre o pet y sus retardos. Si miramos a los coecientes de correlacin entre estas variables, vemos o que son muchos cercanos a uno, indicando esa alta correlacin entre estos regresores. o Coecientes de correlacin, usando las observaciones 1913 - 1984 o (se ignoraron los valores perdidos) valor cr tico al 5 % (a dos colas) = 0,2319 para n = 72 pe 1, 0000 pe 1 0, 9636 1, 0000 pe 2 0, 9090 0, 9637 1, 0000 pe 3 0, 8554 0, 9097 0, 9639 1, 0000 pe 4 0, 7996 0, 8579 0, 9111 0, 9645 1, 0000 pe pe pe pe pe
1 2 3 4
Por otro lado, al realizar tanto el contraste secuencial, como el contraste conjunto de que solamente los coecientes que acompaan a pet1 , pet2 , pet3 , pet4 son igual a cero, no se n rechaza la hiptesis nula en cada caso. Por lo tanto se puede decir que el problema no es tanto o de multicolinealidad entre los propios retardos sino entre pet y ellos. Si comenzamos con un nmero de retardos menor, por ejemplo dos, tenemos los mismos u resultados: 240
Anlisis de datos a
SARRIKO-ON 04/10 Estimaciones MCO, usando las observaciones 19151984 (T = 70) Variable dependiente: gfr Desviaciones t picas robustas a autocorrelacin o Coeciente const pe pe 1 pe 2 pill ww2 95,8705 0,0726 0,0057 0,0338 31,3050 22,1265 Desv. T pica 7,55497 0,07856 0,07128 0,07622 5,29729 7,58264 Estad stico t 12,6897 0,9250 0,0811 0,4438 5,9096 2,9180 Valor p 0,0000 0,3584 0,9356 0,6587 0,0000 0,0049 0,459427 4,75e10 0,188715
R2 F (5, 64)
0,498599 15,66942 0,875014
Contraste de omisin de variables o Hiptesis nula: los parmetros son cero para las variables pet , pet1 , pet2 o a Estad stico de contraste asinttico: valor muestral del estad o stico 2 (3) = 5,62982 valor p = 0,14243 no se rechaza la hiptesis nula o Contraste de omisin de variables o Hiptesis nula: los parmetros son cero para las variables pet1 , pet2 o a Estad stico de contraste: valor muestral del estad stico F (2, 64) = 0,0995195 con valor p = 0,905412 no se rechaza la hiptesis nula o
con
Por ello, parece que incluir retardos de pet no mejora la especicacin del modelo, sigue exiso tiendo autocorrelacin en el error, y la multicolinealidad entre pet y sus retardos hace que se o estime de forma imprecisa el efecto contemporneo de la exencin de impuestos sobre la tasa a o de fertilidad. Veamos otra alternativa de introducir dinmica en el modelo. a Seguidamente especicamos un modelo dinmico incluyendo como regresores cuatro retardos a consecutivos de la variable endgena gfr t , es decir, aade gf rt1 , . . . , gf rt4 a la lista de o n regresores del modelo (5.8). gfrt = 1 + 2 pet + 3 pillt + 4 ww2t + 5 gf rt1 + 6 gf rt2 + 7 gf rt3 + 8 gf rt4 + ut (5.12) En este caso lo regresores incluidos son estocsticos, ya que aunque determinadas en el pasado, a o predeterminadas en t, han sido generadas por las propias perturbaciones pasadas del modelo, de ah que sean variables aleatorias gfr t1 , gfr t2 , gfr t3 , gfr t4 . El estimador MCO es sesgado y no se conoce su distribucin exacta o en muestras nitas pero si las perturbaciones del o modelo son un ruido blanco, el estimador ser consistente y los estad a sticos t y F vlidos a asintticamente. o 241
SARRIKO-ON 04/10
Anlisis de datos a
Estimaciones MCO, usando las observaciones 19171984 (T = 68) Variable dependiente: gfr Coeciente const pe pill ww2 gfr 1 gfr 2 gfr 3 gfr 4 8,43045 0,02864 5,34771 2,52153 1,14486 0,58858 0,46819 0,13390 Desv. T pica 3,15685 0,00967 1,49830 2,04522 0,12777 0,18519 0,18511 0,12220 Estad stico t 2,6705 2,9599 3,5692 1,2329 8,9601 3,1782 2,5292 1,0958 Valor p 0,0097 0,0044 0,0007 0,2224 0,0000 0,0023 0,0141 0,2776 0,962818 7,40e42 2,088677
R2 F (7, 60)
0,966703 248,8517 0,048412
Por el contrario, si se detecta autocorrelacin en el trmino de error, entonces el estimador o e MCO no ser consistente y la inferencia tampoco ser vlida. Por esa razn es importante a a a o contrastar si hay o no evidencia de autocorrelacin. Para ello, el estad o stico de Durbin-Watson no es able, dado que como regresores tenemos retardos de la variable endgena. Utilizareo mos el contraste de Breusch-Godfrey. Contrastamos la hiptesis nula de que el trmino de o e perturbacin es un ruido blanco, frente a la alternativa de que sigue un proceso AR(1) o o MA(1). El resultado del contraste se muestra a continuacin: o Contraste Breusch-Godfrey de autocorrelacin de primer orden MCO, usando las o observaciones 1917-1984 (T = 68) Variable dependiente: uhat Coeciente Desv. T pica Estad. t Valor p const -3,78284 4,20750 -0,8991 0,3723 pe -0,01652 0,01557 -1,0610 0,2930 pill 2,83789 2,57773 1,1010 0,2754 ww2 1,53037 2,32700 0,6577 0,5133 gf r1 0,58349 0,45098 1,2940 0,2008 gf r2 -0,65901 0,52223 -1,2620 0,2119 gf r3 0,29550 0,28607 1,0330 0,3058 gf r4 -0,16737 0,17361 -0,9641 0,3390 uhat1 -0,61992 0,45977 -1,3480 0,1827 El coeciente de determinacin de esta regresin auxiliar es R2 = 0, 029892, y el valor muestral o o del estad stico: T R2 = 2, 032657 con un valor p de 0,154. Dado el valor p asociado al valor muestral del estad stico del contraste de Breusch-Godfrey no se rechaza la hiptesis nula de o que el trmino de perturbacin sea un ruido blanco frente a la alternativa de que siga un e o AR(1) o MA(1). Por lo tanto, no parece haber evidencia de autocorrelacin hasta de orden o uno. 242
Anlisis de datos a
SARRIKO-ON 04/10
Podemos considerar como ables los resultados para hacer inferencia, al menos vlida asinttia o camente, sobre la signicatividad de las variables incluidas. Todas las variables son individualmente signicativas a excepcin de la variable ww2 que recoge el periodo de la segunda guerra o mundial y el cuarto retardo de la variable endgena gf rt4 . o Consideramos incluir todos los retardos de pe y gfr de las especicaciones anteriores en el modelo (5.8). El modelo ms general ser a a: gfrt = 1 + 2 pet + 3 pet1 + 4 pet2 + 5 pet3 + 6 pet4 + 7 pillt + 8 ww2t + 9 gf rt1 + 10 gf rt2 + 11 gf rt3 + 12 gf rt4 + ut Los resultados de la estimacin de este modelo y del contraste de Breusch-Godfrey para o contrastar si el trmino de perturbacin es un ruido blanco frente a que siga un AR(1) o e o MA(1) se muestran a continuacin: o Estimaciones MCO, usando las observaciones 19171984 (T = 68) Variable dependiente: gfr Coeciente const pe pe 1 pe 2 pe 3 pe 4 pill ww2 gfr 1 gfr 2 gfr 3 gfr 4 7,21746 0,03757 0,03203 0,09221 0,06771 0,00404 4,70508 0,28547 1,12341 0,44953 0,33774 0,10568 Desv. T pica 2,96855 0,03196 0,03940 0,04277 0,04170 0,02925 1,51670 3,22531 0,13766 0,18893 0,17747 0,12009 Estad stico t 2,4313 1,1754 0,8128 2,1556 1,6237 0,1382 3,1022 0,0885 8,1604 2,3793 1,9030 0,8800 Valor p 0,0183 0,2448 0,4198 0,0354 0,1101 0,8906 0,0030 0,9298 0,0000 0,0208 0,0622 0,3826 0,967606 1,08e39 2,068701 (5.13)
R2 F (11, 56)
0,972925 182,9370 0,042547
El coeciente de determinacin de esta regresin auxiliar es R2 = 0, 028959, y el valor muestral o o 2 = 1, 969205 con un valor p de 0,161. Dado el valor p asociado al valor del estad stico: T R muestral del estad stico del contraste de Breusch-Godfrey no se rechaza la hiptesis nula de o que el trmino de perturbacin sea un ruido blanco frente a la alternativa de que siga un e o AR(1) o MA(1). Por lo tanto, no parece haber evidencia de autocorrelacin hasta de orden o uno. Podemos considerar como ables los resultados para hacer inferencia al menos vlida a asintticamente sobre la signicatividad de las variables incluidas. o
243
SARRIKO-ON 04/10
Anlisis de datos a
Contraste Breusch-Godfrey de autocorrelacin de primer orden MCO, usando las o observaciones 1917-1984 (T = 68) Variable dependiente: uhat Coeciente Desv. T pica Estad stico t Valor p const -3,711730 4,136670 -0,8973 0,3735 pe -0,007805 0,032362 -0,2412 0,8103 pe1 0,030136 0,045708 0,6593 0,5124 pe2 -0,024036 0,046493 -0,5170 0,6072 -0,059447 0,062240 -0,9551 0,3437 pe3 pe4 0,045326 0,045809 0,9895 0,3268 pill 2,892880 2,715980 1,0650 0,2915 ww2 0,238492 3,212430 0,0742 0,9411 gf r1 0,662843 0,535351 1,2380 0,2209 gf r2 -0,735456 0,604202 -1,2170 0,2287 gf r3 0,248948 0,262536 0,9482 0,3472 gf r4 -0,124160 0,153815 -0,8072 0,4230 uhat1 -0,685005 0,534860 -1,2810 0,2057
A continuacin omitimos de forma secuencial todas las variables que encontramos no signio cativas al nivel de signicacin del 5 %, incluyendo variables retardadas y no retardadas. o Eliminacin secuencial utilizando alfa= 0,05 a dos colas o Quitando ww2 (valor p 0,930) no se rechaza que el Quitando pet4 (valor p 0,907) no se rechaza que el Quitando pet1 (valor p 0,403) no se rechaza que el Quitando gf rt4 (valor p 0,327) no se rechaza que el Quitando pet (valor p 0,270) no se rechaza que el coeciente coeciente coeciente coeciente coeciente sea sea sea sea sea cero cero cero cero cero no se rechaza.
Hiptesis nula: los parmetros de regresin asociados a pet , pet1 , pet4 , ww2, gf rt4 son cero. o a o Estad stico de contraste: F(5, 56) = 0,567449, con valor p = 0,724516 Por lo tanto, la especicacin nal ser o a: gfrt = 1 + 2 pet2 + 3 pet3 + 4 pillt + 5 gf rt1 + 6 gf rt2 + 7 gf rt3 + ut Estimaciones MCO, usando las observaciones 19171984 (T = 68) Variable dependiente: gfr Coeciente const pe 2 pe 3 pill gfr 1 gfr 2 gfr 3 6,77128 0,09150 0,06207 5,13607 1,06757 0,40369 0,23931 Desv. T pica 2,79399 0,02395 0,02510 1,38690 0,11527 0,16115 0,10765 244 Estad stico t 2,4235 3,8199 2,4726 3,7033 9,2609 2,5051 2,2230 Valor p 0,0184 0,0003 0,0162 0,0005 0,0000 0,0149 0,0299 (5.14)
Anlisis de datos a R2 F (6, 61) 0,971553 347,2224 0,015698 R2 corregido Valor p (de F ) h de Durbin 0,968755 3,41e45 0,388041
SARRIKO-ON 04/10
Contraste Breusch-Godfrey de autocorrelacin de primer orden MCO, usando las o observaciones 1916-1984 (T = 69) Variable dependiente: uhat Coeciente Desv. T pica Estad. t Valor p const 0,398790 3,1035 0,1285 0,8982 pe2 0,000711 0,02436 0,02918 0,9768 pe3 0,000818 0,02542 0,03219 0,9744 pill -0,262979 1,65241 -0,1591 0,8741 gf r1 -0,060770 0,240580 -0,2526 0,8014 gf r2 0,064050 0,275406 0,2326 0,8169 gf r3 -0,008623 0,111933 -0,07704 0,9388 uhat1 0,077286 0,268101 0,2883 0,7741 El coeciente de determinacin de esta regresin auxiliar es R2 = 0, 001360, y el valor muestral o o 2 = 0, 093872 con un valor p de 0,759. No hay evidencia de autocorrelacin del estad stico: T R o hasta de orden uno. Esta especicacin dinmica parece adecuada, las variables son individual y conjuntamente o a signicativas y no hay evidencia de que el trmino de perturbacin no sea un ruido blanco. e o Finalmente podemos decir que la existencia de autocorrelacin en las especicaciones anteo riores se deb a una mala especicacin del modelo y que incluyendo dinmica en la parte a o a sistemtica mediante las variables gf rt1 , gf rt2 , gf rt3 , pet2 , pet3 la hemos controlado. a
5.4.
Adems de los ejercicios que se resuelven en clase tenis a vuestra disposicin una coleccin a e o o de ejercicios de examen que se actualiza cada ao. No deber dar por acabado el trabajo de n ais cada tema hasta que estn hechos los ejercicios recomendados en clase. a Ejercicio M-MD.1: Se quiere estudiar la dependencia de la bolsa de Madrid de las bolsas de Japn y Par Para o s. ello se dispone de 30 observaciones diarias de los ndices IBEX, NIKKEI y CAC 40. Suponiendo que la bolsa madrilea es un seguidor de estas bolsas se propone el siguiente modelo: n IBEXt = 1 + 2 N IKKEIt1 + 3 CACt1 + ut Su estimacin por MCO proporciona el siguiente resultado: o IBEX t = 0, 0096 + 0, 500 N IKKEIt1 0, 1799 CACt1 M CO )) (0,0022) (0,1199) (0,1899) (des( R2 = 0, 68 DW = 0, 82 (5.15) con t : 2, . . . , 50.
245
SARRIKO-ON 04/10
Anlisis de datos a
1. Contrasta la signicatividad individual de las variables explicativas; es la bolsa madrilea seguidor de la bolsa de Japn? y de la de Paris? n o 2. Es el modelo dinmico? a 3. Contrasta la existencia de autocorrelacin de tipo AR(1) en las perturbaciones. Especio ca claramente la hiptesis nula, la alternativa, el estad o stico de contraste y la regla de decisin. o 4. Comenta la siguiente armacin: Al existir como regresores variables retardadas y autoo correlacin, el estimador MCO es inconsistente. o Posteriormente se aade la variable explicativa IBEXt1 al modelo, ya que se considera n relevante el valor del ndice al cierre del d anterior en la evolucin del mismo al d siguiente. a o a Se estima por MCO, con la misma muestra, obteniendo:
IBEX t = 0, 003 + 0, 1910 IBEXt1 + 0, 8400 N IKKEIt1 0, 0600 CACt1 M CO )) (0,0011) (0,0800) (0,2460) (0,0120) (des( DW = 1, 9 (5.16)
v t = 0, 0001 + 0, 03 vt1 + 0, 009 IBEXt1 + 0, 04 N IKKEIt1 0, 006 CACt1 (0,002) (0,009) (0,3) (0,1) (0,03) (des) R2 = 0, 09
5. Contrasta la hiptesis de existencia de autocorrelacin de tipo AR(1) en vt . o o 6. A la vista de los resultados del contraste anterior razona las propiedades del estimador MCO. 7. Explica un mtodo de estimacin alternativo a MCO para el modelo (5.16) que tenga e o mejores propiedades. Ejercicio M-MD.2: Una empresa considera que sus benecios anuales (Y ) dependen de sus gastos en publicidad (X) y de sus benecios del ao anterior. Para saber cul ha sido la relacin entre estas variables n a o durante los ultimos 5 aos, decide estimar el modelo: n Yt = 1 + 2 Xt + 3 Yt1 + ut , con los siguientes datos: t Yt Xt 1 -10 4 2 16 16 3 2 6 4 4 6 5 -4 0 t = 1, 2, . . . , 5 (5.17)
246
Anlisis de datos a 1. Realiza la estimacin de los coecientes de (5.17) por MCO. o 2. Es este estimador lineal? Es insesgado? Por qu? e
SARRIKO-ON 04/10
3. Realiza la estimacin de los coecientes de (5.17) por el mtodo de variables instrumeno e tales, utilizando Xt1 como instrumento para Yt1 . Escribe cules son las matrices hasta a llegar al resultado nal. 4. Es este estimador lineal? Es insesgado? Por qu? e 5. Te parece Xt1 un instrumento adecuado para Yt1 ? Por qu? e 6. Si se considera como instrumento adicional a Xt2 : i) Explica el procedimiento de MC2E para estimar los coecientes del modelo. ii) Completa: Z= M C2E = 1
Yt1 = . . . . . . . . . . . . . . . . . . . . . Ejercicio M-MD.3: Sea el modelo Yt = 1 + 2 Xt + 3 Xt1 + 4 Yt1 + ut con X ja y ut = ut1 + t ,

2 donde t iid(0, ).
t = ......
(5.18)
1. Es el estimador MCO consistente? Explica razonadamente por qu. e 2. Cambiar tu respuesta si en lugar de Yt1 tuvisemos Yt2 como variable explicativa a e en el modelo? Por qu? e 3. En el modelo (5.18), propn un estimador del vector de parmetros que por lo menos o a sea consistente. Razona la respuesta.
5.5.
Prcticas de Aula a
Las prcticas de aula son clases participativas, ello quiere decir que el alumno debe acudir a clase a con el ejercicio realizado en su tiempo de trabajo personal. Previamente y con anticipacin sucieno te se le habr realizado la debida propuesta. Durante la clase se preguntar aleatoriamente a los a a alumnos sobre lo realizado. En el tema de modelos dinmicos es habitual disponer de una prctica de aula, lo que equivale a a a una hora de clase presencial y dos horas de trabajo personal. Si el ejercicio ha sido realizado 247
SARRIKO-ON 04/10
Anlisis de datos a
previamente por el alumno el tiempo es suciente para su correccin y solucin de dudas existentes. o o A continuacin se va a proponer un enunciado correspondiente a las prctica citada. o a
Competencias a trabajar en estas sesiones. 1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e 3. Utilizar diversas fuentes estad sticas y adquirir destreza en el uso de un software economtrico e para analizar relaciones entre variables econmicas. o
Prctica de Aula PA-MD.1: a Un investigador dispone de una base de datos anuales, para el per odo de 1948 a 1993, de los 4: siguientes ndices agrarios de EEUU, todos ellos con base 1982 output : produccin agr o cola (Rango 51 - 116). labor : mano de obra agr cola (Rango 81 - 278). land : supercie utilizada en la produccin agr o cola (Rango 89 - 102) machines : maquinaria (duradera) (Rango 38 - 102) El objetivo del investigador es determinar la funcin de produccin agraria, para ello especica el o o siguiente modelo de regresin lineal: o outputt = 1 + 2 labort + 3 landt + 4 machinest + ut t = 1, . . . , T (5.19)
en el que se considera que los regresores son no estocsticos. Los resultados obtenidos de la estimacin a o MCO son los que se muestran a continuacin: o
outputt = 181, 201 0, 307 labort 0, 517 landt 0, 096 machinest M CO )) (40,194) (0,038) (0,564) (0,169) (des( R2 = 0, 884 DW = 0, 612 SCR = 1885, 08 T = 46 1. Explica cmo se han calculado los residuos y para qu sirven los grcos. Interpreta ambos o e a grcos y seala si existe alguna evidencia de que la perturbacin del modelo no cumpla a n o alguna de las hiptesis bsicas, justicando tu respuesta. o a
4 Fichero data9-5.gdt disponible en gretl pestaa Ramanathan. Fuente: Ramanathan, Ramu (2002): Introductory n Econometrics with Applications.
248
Anlisis de datos a
SARRIKO-ON 04/10
Figura 5.7: Grco de residuos y de la serie gfr observada y ajustada a

Residuos de la regresin (= output observada estimada) 15 120 estimada observada 110 10 100 5 90 residuo output output observada y estimada
80
70 5 60 10 50
15 1950 1955 1960 1965 1970 1975 1980 1985 1990
40 1950 1955 1960 1965 1970 1975 1980 1985 1990
2. Realiza algn contraste basndote en la informacin disponible, para cualquier problema deu a o tectado en el apartado anterior. Explica detalladamente todos los elementos que intervengan. 3. Con respecto a los contrastes de signicatividad individual de las variables explicativas del modelo (5.19): a) Es able realizarlos utilizando la informacin disponible? Por qu? o e b) Ser posible llevarlos a cabo si no tuvisemos otra opcin que la de estimar los coea e o cientes del modelo por MCO? Explica cmo lo har en caso armativo. o as Viendo los resultados obtenidos el investigador decide estimar el mismo modelo por el mtodo de e Cochrane-Orcutt (CO). A continuacin se muestran los resultados obtenidos: o Estimaciones CochraneOrcutt utilizando las 45 observaciones 19491993 Variable dependiente: output = 0.791585 Coeciente const labor land machines 54,3902 0,4046 1,0727 0,2874 Desv. T pica 30,3065 0,0649 0,3741 0,2000 Estad stico t 1,7947 6,2284 2,8673 1,4372 Valor p 0,0801 0,0000 0,0065 0,1583
Estad sticos basados en los datos rho-diferenciados: R2 F (3, 41) 0.957590 12.99460 0.184791 R2 corregido Valor p (de F ) DurbinWatson 249 0.954487 4.18e06 2.339505
SARRIKO-ON 04/10
Anlisis de datos a
918, 486 0, 175515 9, 59451 0, 06293 0, 175515 0, 00422165 0, 00963229 0, 00270274 V (CO ) = 9, 59451 0, 00963229 0, 139972 0, 034905 0, 06293 0, 00270274 0, 034905 0, 0400013 4. Cundo ests dispuesto a aplicar este mtodo de estimacin? En particular, consideras a a e o adecuado utilizar este mtodo en las circunstancias actuales? Responde razonadamente. e 5. Describe detalladamente cmo obtener las estimaciones de los coecientes del modelo (5.19) o utilizando el mtodo del apartado anterior. e 6. Con la informacin disponible, realiza el siguiente contraste H0 : 2 = 3 . Escribe la hiptesis o o nula, la alternativa, el estad stico de contraste junto con su distribucin y realiza el contraste. o Cmo interpretas el resultado? o A continuacin el investigador introduce un retardo de la variable endgena como variable explicao o tiva en el modelo inicial, con la pretensin de recoger la inuencia de la produccin agr o o cola del ao n anterior: outputt = 1 + 2 labort + 3 landt + 4 machinest + 5 outputt1 + vt Estimado el modelo por MCO se obtienen los siguientes resultados: Estimaciones MCO utilizando las 45 observaciones 19491993 Variable dependiente: output Coeciente const labor land machines output 1 R2 F (4, 40) BG(1) 26,6869 0,0868 0,6694 0,1715 0,8535 0.959224 235.2394 0.299970 6,199 Desv. T pica 33,4166 0,0356 0,3649 0,1013 0,0979 Estad stico t 0,7986 2,4339 1,8342 1,6929 8,7126 Valor p 0,4292 0,0195 0,0741 0,0983 0,0000 0.955146 3.26e27 2.617899 0.0128 t = 2, . . . , T (5.20)
R2 corregido Valor p (de F ) h de Durbin Valor p (de BG(1))
7. Utilizando esta informacin, explica detalladamente la validez del siguiente estad o stico de contraste 5,M CO 0 H0 ,d N (0, 1) desv(5,M CO ) para argumentar a favor de incluir en el modelo el retardo de la variable endgena como o variable explicativa. 250
Anlisis de datos a
SARRIKO-ON 04/10
Alternativamente se ha obtenido la siguiente estimacin consistente y asintticamente eciente de o o los coecientes del modelo (5.20): outputt outputt1 = 27, 47 (1 ) 0, 058 (labort labort1 ) (0,028) Q X LB
t t t
+ 0, 546 (landt landt1 ) 0, 130 (machinest machinest1 ) (0,304) (0,081) LN M A

t t
+ 0, 925 (outputt1 outputt2 ) +t (0,076) Q

t1
(5.21)
R = 0, 976 siendo
t
DW = 2, 30
es un ruido blanco tal que
= vt vt1 y vt son las perturbaciones del modelo (5.20).
8. Completa y/o realiza lo siguiente: a)

t
......(
b) Cul es el mtodo de estimacin que se ha utilizado? a e o c) Cul es el estimador consistente de empleado? Describe todos los elementos y las a condiciones que te garantizan la consistencia del parmetro estimado. a d) Escribe la expresin matricial del estimador utilizado: o
27, 47
.........
......... .........
.........
.........
.........
0, 058 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ......... 0, 546 = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0, 130 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .........

0, 925 ......... ......... ......... ......... .........
......... ......... .........

.........
9. Utilizando la informacin contenida en la ecuacin (5.21), explica detalladamente la validez o o del siguiente estad stico de contraste 5 0 H0 ,d N (0, 1) des(5 ) para argumentar a favor de incluir en el modelo el retardo de la variable endgena como o variable explicativa. Finalmente, incluir dicha variable en el modelo? as 10. Cul es el estimador ptimo, dada toda la informacin de que dispones, para los parmetros a o o a de la ecuacin (5.20)? Razona tu respuesta detalladamente en relacin a todas las alternativas o o posibles. 251
SARRIKO-ON 04/10
Anlisis de datos a
5.6.
En el tema de modelos dinmicos es habitual disponer de dos prcticas de ordenador que equivalen a a a dos horas presenciales y cuatro horas de trabajo no presencial para repasar lo visto y repetir la mecnica. A continuacin se va a proponer un ejercicio para resolver en el centro de clculo. El a o a enunciado sigue el ejemplo emp rico de modelizacin dinmica que se ha presentado anteriormente o a en las clases magistrales. Cubre todo lo aprendido en la asignatura sobre modelizacin en especial o utilizando datos de series temporales. Las competencias a trabajar en estas prcticas de ordenador son: a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e 3. Utilizar diversas fuentes estad sticas y adquirir destreza en el uso de un software economtrico e para analizar relaciones entre variables econmicas. o Recordatorio: Es conveniente que una vez acabado el ejercicio y en vuestro tiempo de trabajo personal relacionis lo aprendido en la prctica de ordenador con el contenido del ejemplo emp e a rico de este tema, ya que se van explicando los resultados de esta prctica. Es decir, en clase unicaa mente os da tiempo a aprender la mecnica, la ejecucin sucesiva de instrucciones para obtener los a o resultados pedidos, aunque el profesor va comentando y explicando los resultados. Debis entene der convenientemente los resultados obtenidos, y a la vez vosotros mismos experimentar con otras posibles especicaciones dinmicas. a Prctica de ordenador PO-MD.1 a En un estudio sobre la pol tica de natalidad del gobierno de E.E.U.U. en el siglo XX se tienen datos anuales sobre las siguientes variables5 , para el per odo 1913-1984: gfr: pe : year : pill : ww2 : tasa general de fertilidad6 . valor real en dlares de la exencin en el pago de impuestos personales. o o tendencia temporal t=1,...,72 (de 1913 a 1984). variable cticia igual a 1 en el ao de introduccin de la p n o ldora 1963. variable cticia igual a 1 si el ao est entre 1941 y 1945 (2a guerra mundial) n a
Inicialmente se especica el modelo gfrt = 1 + 2 pet + ut (5.22)
1. Da estructura de series temporales al conjunto de datos disponible pulsando en la pantalla principal en Datos Estructura del conjunto de datos . . .
5 Fichero data 9-5.gdt disponible en gretl pestaa Wooldridge. Fuente: Wooldridge, J.M. (2001), Introduccin a la n o Econometr a.
252
Anlisis de datos a
SARRIKO-ON 04/10
2. Estima por MCO el modelo propuesto en (5.22). Interpreta los resultados. (A resolver en casa) 3. Obtn el grco de series temporales de la variable gfrt y de los residuos. Comntalos a la e a e vista del R2 obtenido en el apartado anterior. (A resolver en casa) 4. Reestima el modelo incluyendo los regresores pillt y ww2t , Qu pretenden recoger cada uno e de ellos? Tiene su inclusin algn efecto sobre los grcos anteriores? o u a 5. Contrasta la existencia de autocorrelacin de primer orden con el estad o stico de Durbin Watson. 6. Teniendo en cuenta toda la informacin disponible hasta ahora, contrasta la signicatividad o individual de la variable pe. 7. Estima el modelo por el mtodo de Cochrane-Orcutt. Comenta los resultados obtenidos, reae lizando los contrastes que fuesen necesarios. 8. Aade como regresor la variable retardada un periodo gfrt1 al modelo y est n malo por MCO. Obtn el grco de los residuos y comntalo. Realiza un contraste de autocorrelacin de orden e a e o 1 y, a partir de ese resultado, comenta los resultados del anlisis. Crees necesario utilizar a algn otro estimador? Por qu? u e 9. Aade al modelo una tendencia temporal t. Dado el grco de residuos que se obtiene, prueba n a a incluir tambin una tendencia cuadrtica, t2 . (A resolver en casa) e a 10. Realiza el contraste de Durbin-Watson en este modelo. Comenta los resultados. (A resolver en casa) 11. Cmo contrastar la signicatividad individual de las variables explicativas incluidas en el o as modelo? Utiliza siempre un estimador adecuado para los errores estndar de los coecientes a con la informacin de la que dispones hasta ahora. o Prctica de ordenador PO-MD.2 a En un estudio sobre la pol tica de natalidad en los E.E.U.U. en el siglo XX se tienen los datos siguientes de frecuencia anual sobre las variables siguientes7 , para el periodo 1913-1984: gfr: pe : year : pill : ww2 : tasa general de fertilidad8 . valor real en dlares de la exencin en el pago de impuestos personales. o o tendencia temporal t=1,...,72 (de 1913 a 1984). variable cticia igual a 1 en el ao de introduccin de la p n o ldora 1963. variable cticia igual a 1 si el ao est entre 1941 y 1945 (2a guerra mundial) n a
Se parte de la siguiente especicacin: o gfrt = 1 + 2 pet + 3 pillt + 4 ww2t + ut (5.23)
7 Fichero data 9-5.gdt disponible en gretl pestaa Wooldridge. Fuente: Wooldridge, J.M. (2001), Introduccin a la n o Econometr a.
253
SARRIKO-ON 04/10
Anlisis de datos a
1. Dale al conjunto de datos estructura de series temporales pulsando en la ventana principal de Gretl, Datos Estructura de datos . . . 2. Estimar por MCO el modelo propuesto en (5.23). Comprueba la existencia de autocorrelacin o en este modelo. 3. Especica un modelo dinmico incluyendo como regresores cuatro retardos consecutivos de la a variable endgena gfr t , es decir, aade gf rt1 , . . . , gf rt4 a la lista de regresores. Comprueba o n su signicatividad, individual y conjunta, a travs de estad e sticos vlidos. a 4. Especica un modelo dinmico diferente incluyendo como regresores cuatro retardos consecua tivos de la variable pet , es decir, aade pet1 , . . . , pet4 a la lista de regresores. Comprueba n su signicatividad, individual y conjunta, a travs de estad e sticos vlidos. Introduce esta a especicacin algn otro problema conocido? o u 5. Incluye todas las variables consideradas en las preguntas 3 y 4 anteriores. Despus, basndote e a en contrastes de hiptesis, y de forma secuencial: o a) Omite la variable gfr t4 . b) Omite todas las variables que encuentres no signicativas al nivel de signicacin del 5 %, o incluyendo variables retardadas y no retardadas. Puedes tener que reestimar el modelo varias veces. c) Guarda a sesin como icono el modelo nal que hayas considerado como el mejor y escribe o su Funcin de Regresin Muestral. o o (OPCIONAL) Ahora, considera el modelo siguiente: gfrt = 1 + 2 pet2 + 3 pillt + 4 ww2t + ut (5.24)
6. Contrasta la existencia de autocorrelacin en el modelo (5.24). En vez de aadir variables reo n tardadas, obtn un estimador eciente (asintticamente) de sus parmetros. Escribe el modelo e o a transformado relacionado y los valores para todos los parmetros estimados i y . a 7. Intenta obtener la mejor especicacin, de entre las de las preguntas 5c) y 6. Ayuda: o a) Contrasta las restricciones pertinentes en el modelo nal de la pregunta 5c). b) Examina cuidadosamente los grcos de residuos de los dos modelos estimados. a
5.7.
Los talleres son clases participativas, ello quiere decir que el alumno debe acudir a clase con el ejercicio realizado en su tiempo de trabajo personal. Previamente y con anticipacin suciente se le o habr realizado la debida propuesta. El ejercicio debe resolverse en grupo, idealmente en el grupo a en que se va a realizar el proyecto. Esto favorece la interrelacin y conocimiento entre los miembros. o En los ultimos 15 minutos de clase, un representante de cada grupo deber exponer al resto de a 254
Anlisis de datos a
SARRIKO-ON 04/10
la clase la decisin adoptada por el grupo junto a las razones consideradas. Durante la clase se o preguntar aleatoriamente y de forma individual a los alumnos sobre lo realizado. a En el tema de modelos dinmicos en general se lleva a cabo un taller. El objetivo del taller es anaa lizar una serie de resultados de la estimacin de varias especicaciones de un modelo o diferentes o estimaciones de la misma especicacin y que el alumno pueda ir practicando la toma de decisiones o y la redaccin apropiada de conclusiones. o Una hora de trabajo en un taller en clase equivale a dos horas de trabajo personal sobre el mismo. Adems es necesario que en este tiempo se reexione y redacten los argumentos y conclusiones a a las que se haya llegado en clase. Competencias a trabajar en esta sesin. o 1. Comprender la importancia de los supuestos empleados en la especicacin de un modelo o economtrico bsico para poder proponer y emplear supuestos ms realistas. e a a 2. Diferenciar distintos mtodos de estimacin y evaluar su uso de acuerdo a las caracter e o sticas de las variables econmicas de inters para obtener resultados ables. o e 3. Utilizar diversas fuentes estad sticas y adquirir destreza en el uso de un software economtrico e para analizar relaciones entre variables econmicas. o 4. Elaborar en grupos de trabajo y exponer en pblico, un proyecto emp u rico donde se valore adecuadamente los resultados obtenidos del anlisis de un modelo economtrico. a e
Enunciado del taller: Objetivo: Analizar las distintas especicaciones dinmicas para proponer un modelo adecuaa do para los inventarios. Informacin: La informacin se basa en datos datos anuales9 para el periodo 1950 a 1991 o o de las siguientes variables: VENTAS : Ventas de la industria manufacturera en EE.UU. en millones de dlares. o INVENTARIOS : Inventarios de la industria manufacturera en EE.UU. en millones de dlares. o Se considera a la variable V EN T AS no estocstica. a Procedimiento: Debis analizar la informacin disponible y decidir cul es la especicacin e o a o ms adecuada junto con su correcta estimacin. a o
9 Fichero Table12.9.gdt disponible en gretl pestaa Gujarati. Fuente: Ramanathan, Ramu (2002):Introductory Econ nometrics with Applications.
255
SARRIKO-ON 04/10 ESPECIFICACION A. Se propone la siguiente relacin: o IN V EN T ARIOSt = 1 + 2 V EN T ASt + 3 time + ut Estimacin de la ESPECIFICACION A: o Los resultados de la estimacin MCO son los siguientes: o
Anlisis de datos a
t = 1, . . . , 42
(5.25)
IN V EN T ARIOS t = 433, 951 + 1, 543 V EN T ASt + 158, 805 time (2774, 17) (0, 019) (269, 107) des(i ) i )robusto (1143, 38) (0, 01361) (169, 225) des( R2 = 0, 9992 SCR = 2, 202257 + 09 DW = 1, 3755 BG(1) = 4, 061
Junto con los siguientes grcos: a Figura 5.8: Grco de residuos y de la serie INVENTARIOS observada y ajustada a
Residuos de la regresin (= INVENTARIOS observada estimada) 35000 30000 25000 20000 600000 INVENTARIOS 15000 residuo 10000 5000 0 5000 10000 15000 1950 1955 1960 1965 1970 1975 1980 1985 1990 200000 900000 estimada observada 800000 INVENTARIOS observada y estimada
700000
500000
400000
300000
100000
0 1950 1955 1960 1965 1970 1975 1980 1985 1990
1. Analiza la informacin mostrada: Interpreta los dos grcos y si la perturbacin del modelo o a o presenta alguna caracter stica que puede presentar algn problema en la estimacin e inferencia u o de los coecientes del modelo. Realiza el contraste o contrastes que sean pertinentes. Discute por qu crees que el estudiante ha introducido la variable tendencia (time) como regresor en e el modelo y si es relevante incluirla. Utiliza los contrastes que consideres oportunos. Razona tu respuesta.
ESPECIFICACION B: El estudiante considera ahora la inclusin de la variable IN V EN T ARIOSt1 en el modelo y estima o la siguiente especicacin: o IN V EN T ARIOSt = 1 + 2 V EN T ASt + 3 time + 4 IN V EN T ARIOSt1 + ut (5.26)
donde ut es una variable aleatoria con distribucin normal. Los resultados de la estimacin de la o o ecuacin (5.26) son los siguientes: o 256
Anlisis de datos a
SARRIKO-ON 04/10 Estimaciones MCO utilizando las 41 observaciones 19511991 Variable dependiente: INVENTARIOS Coeciente Desv. t pica 2750,0100 0,0950 265,4460 0,0602 estad stico t 0,0571 13,0803 1,2090 3,2154 1,72144e+09 6820,94 0,999308 19248,1 1,59811 0,172087 1,285206 valor p 0,9548 0,0000 0,2343 0,0027
const VENTAS time INVENTARIOS 1
156,9500 1,2438 320,9310 0,1937
Suma de cuadrados de los residuos Desviacin t o pica de la regresin ( ) o R2 corregido F (3, 37) Estad stico de DurbinWatson Coef. de autocorr. de primer orden. BG(1)
Ayuda al estudiante a decidir sobre la abilidad de los distintos resultados de estimacin o mostrados de la especicacin B. Razona tu respuesta en base a la informacin proporcionada. o o Estimacin de la ESPECIFICACION C: o Modelo C: estimaciones MCO utilizando las 41 observaciones 19511991 Variable dependiente: INVENTARIOS Coeciente const VENTAS VENTAS 1 time 56,1070 1,2743 0,2688 331,1920 DW = 1,20853 Desv. t pica 2881,5400 0,1104 0,1085 281,9270 BG(1)=5,70 estad stico t 0,0195 11,5356 2,4775 1,1747 valor p 0,9846 0,0000 0,0179 0,2476
uM CO,t = 0, 383549 uM CO,t1
Debis decidir qu especicacin A, B o C y qu mtodo de estimacin os parece es el ms adecuado e e o e e o a dada la informacin proporcionada o si pensis que puede haber un mtodo alternativo. o a e
5.8.
Se recuerda que dado que el curso contempla la evaluacin continua es necesario que a lo largo o del tema se evale a los alumnos, tanto en las clases magistrales, como en las prcticas de aula y u a ordenador. Se llevan a cabo en clase y de manera individual. A modo de ejemplo se incluyen las siguientes.
257
SARRIKO-ON 04/10 Preguntas cortas en Clases Magistrales: Pc.1 Dado el modelo: outputt = 1 + 2 labort + 3 landt + 4 outputt1 + vt Marca lo que sea cierto: 1. outputt1 es un regresor jo porque est predeterminado en t. a a) Cierto b) Falso 2. outputt1 siempre es una variable aleatoria independiente de vt a) Cierto b) Falso
2 3. Sea vt iid(0, v ) a) E(outputt1 vt ) = 0
Anlisis de datos a
t = 2, . . . , T
(5.27)
b) E(Outputt1 vt ) = 0
2 4. Sea vt = vt1 + t donde t iid(0, ) a) E(outputt1 vt ) = 0 b) E(outputt1 vt ) = 0
Pc.2 utilizando los siguientes resultados,
Yt = 4, 84 0, 66 Xt 0, 88 Yt1 t = 2, . . . , 100 (0,36) (0,038) (0,03) (des(M CO )) R2 = 0, 91 DW = 1, 7 y las siguientes regresiones auxiliares: i) ut ii) ut iii) ut ut iv) 2 = = = = 0, 09 + 0, 16t1 + 0, 004Xt 0, 01Yt1 + v1t u 0, 35t1 + 0, 1Xt + 0, 06Yt1 + v2t u 0, 3 + 0, 24t1 + v3t u ut1 0, 13 + 0, 2 2 + 0, 19Xt + 0, 02Yt1 + v4t R2 R2 R2 R2 = 0, 024, = 0, 018, = 0, 005, = 0, 354, SCT SCT SCT SCT = 738, 3 = 738, 3 = 738, 3 = 98, 7
Marca lo que sea cierto: 1. M CO = + (X X)1 (X u) a) Es lineal en u 2. M CO = + (X X)1 (X u) a) Es insesgado 3. M CO = + (X X)1 (X u) b) Es no lineal en u b) Es sesgado
a) Es consistente b) No es consistente M CO = + (X X)1 (X u) 4. a) Tiene distribucin conocida en muestras nitas o b) No tiene distribucin conocida en muestras nitas o
258
Anlisis de datos a Preguntas cortas en Prcticas de Aula: a
SARRIKO-ON 04/10
Pc.1 Sea el siguiente modelo Yt = 1 + 2 Xt + 3 Yt1 + ut , donde ut = ut1 + 2 a t iid(0, ) y Xt es no estocstica. 1. Por qu es no lineal el estimador de M CO ? e
|| < 1
2. Razona la relacin entre las variables Yt1 y ut y completa E(Yt1 ut ) = . . . . . . . . . o 3. Propn un estimador consistente de los coecientes i o i = 1, 2, 3. a) Nombre: b) Expresin matemtica: o a c) Comenta razonadamente cules son sus propiedades: a Pc.2 Considera el siguiente modelo: Yt = 1 Yt1 + 2 Xt + ut Considera las siguientes alternativas de estimacin: o Mtodo 1: Usando t = 2, . . . , 101 observaciones e 1 2
2 Yt1 Yt1 Xt
(5.28)
Yt1 Xt 2 Xt
Yt1 Yt Xt Yt
(5.29)
1. Qu mtodo de estimacin est utilizando? e e o a 2. Si se tiene evidencia de autocorrelacin en el trmino de perturbacin, qu propiedades o e o e tiene el estimador? Mtodo 2: Usando t = 2, . . . , 101 observaciones e 1 2 Xt1 Yt1 Xt Yt1 Xt1 Xt 2 Xt
1
Xt1 Yt Xt Yt
(5.30)
3. Qu mtodo de estimacin est utilizando? e e o a 4. Qu propiedades tiene el estimador? e

Mtodo 3: Siendo Yt = (Yt Yt1 ), Xt = (Xt Xt1 ), utilizando t = 3, . . . , 101 e observaciones
1 2
2 Yt1 Yt1 Xt
Yt1 Xt 2 Xt
Yt1 Yt Xt Yt
(5.31)
= y ut = Yt 1,V I Yt1 + 2,V I Xt
ut ut1 u2 t1
(5.32)
259
SARRIKO-ON 04/10 5. Qu mtodo de estimacin est utilizando? e e o a 6. Qu propiedades tiene el estimador? e
Anlisis de datos a
7. A la vista de lo comentado en los apartados anteriores, qu investigador ha utilizado el e mejor estimador? Razona tu respuesta. Preguntas cortas en Prcticas de Ordenador: a Un estudiante pretende estudiar los determinantes de consumo de gasolina en U.S. Para ello dispone de observaciones anuales en el per odo de 1960 a 1995 sobre las siguientes variables10 : G: Consumo de gasolina total, en U.S., gasto total dividido por su ndice de precios. Pg: Indice de precios de la gasolina. R: Renta disponible, per cpita. a Ps: Indice de precios agregado del consumo de servicios. Se considera a las variables Pg, R y Ps no estocsticas. El estudiante propone la siguiente especia cacin: o Gt = 1 + 2 P gt + 3 Rt + 4 P st + 5 Gt1 + ut Pc.1 Estima el modelo por MCO y completa: Gt = ( (des(M CO )) + ) R2 = ( ) P gt + ( DW = ) Rt + ( ) P st + ( ) Gt1 t = 1, . . . , 42 (5.33)
Se considera que ut puede seguir un proceso AR(p) o MA(p) con p hasta de orden 2. Realiza el contraste oportuno. i) Escribe la hiptesis nula, la alternativa y el estad o stico de contraste que vas a utilizar junto con su distribucin bajo la hiptesis nula. Indica claramente de dnde salen cada o o o uno de los elementos de este estad stico. ii) Apl calo a los datos del archivo y completa: Regresin auxiliar obtenida: o ...... = ................................................................................................................................ R2 = Valor muestral del estad stico = Valor cr tico para un nivel de signicacin ( = 5 %)= o Aplica la regla de decisin: o iii) Qu puedes decir de la consistencia del estimador empleado? cmo es plim M CO ? e o
10 Fichero greene7-8.gdt disponible en gretl pestaa Greene. Fuente: Ramanathan, Ramu (2002): Introductory Econ nometrics with Applications.
260
Anlisis de datos a
SARRIKO-ON 04/10
Pc.2 Estima el modelo por MC2E usando como instrumentos const, P gt , P gt1 , Rt , Rt1 , P st y P st1 y completa: Gt = ( (des(V I )) + ) ( ) P gt + ( ) Rt + ( ) P st + ( ) Gt1
i) Razona si los instrumentos son adecuados. ii) Qu propiedades tiene el estimador obtenido? Son ables las desviaciones t e picas obtenidas? Pc.3 Estima el modelo por el mtodo de Hildreth-Lu. Apl e calo a los datos del archivo y completa: Gt = ( (des(HL )) = + ) ( ) P gt + ( ) Rt + ( ) P st + ( ) Gt1
valor mnimo de SCR =
Qu propiedades tiene el estimador obtenido? Son ables las desviaciones t e picas obtenidas?
261
SARRIKO-ON 04/10
Anlisis de datos a
5.9.
Referencias Bibliogrcas Bsicas: a a Terica: o [1] Greene, W. (1998), Anlisis Economtrico, ed. Prentice Hall, 3a edition. a e [2] Ramanathan, R. (2002), Introductory Econometrics with applications, ed. South-Western, 5th edition. [3] Wooldridge, J. M. (2003), Introductory Econometrics: A modern Approach, ed. South-Western, 2nd edition. Ejercicios: [1] Alegre, J., Arcarons, J., Bolanc, C. y D L. (1995), Ejercicios y Problemas de Econometr e az, a, Coleccin Plan Nuevo, ediciones AC. o [2] Fernndez, A., Gonzlez, P., Reglez, M., Moral, P., Esteban, V. (2005), Ejercicios de Econoa a u metr ed. McGraw-Hill, 2 a edicin. a, o [3] Recopilacin de ejercicios recomendados y exmenes de Econometr Departamento de Econom o a a. a Aplicada III (Econometr y Estad a stica). Mimeo Febrero 2009. Ejercicios con gretl: [1] Ramanathan, R. (2002) Instructors Manual to accompany, del libro Introductory Econometrics with applications, ed. South-Western, 5th edition, Harcourt College Publishers. [2] Wooldridge, J.M. (2003), Student Solutions Manual, del libro Introductory Econometrics: A modern Approach, ed. South-Western, 2nd edition. Referencias Bibliogrcas Complementarias: a [1] Alonso, A., Fernndez, J. y Gallastegui, I. (2005), Econometr ed. Pearson: Prentice Hall. a a, [2] Gujarati, D. (2004), Econometr ed. McGraw-Hill, 4a edicin. a, o [3] Johnston, J. (1984), Mtodos de Econometr ed. Vicens Vivens, 4a edicin. e a, o [4] Maddala, G. S. (1996), Introduccin a la Econometr ed. Pearson: Prentice Hall. o a, [5] Novales, A. (1993), Econometr ed. McGraw-Hill, 2a edicin. a, o [6] Pindyck, R. S. y Rubinfeld, D. L. (1998), Econometric Models and Economic Forecast, ed. McGraw-Hill, 4a edicin. o
262
Anlisis de datos a
SARRIKO-ON 04/10
5.10.
Anexo: Instrucciones bsicas de gretl para modelos dinmicos a a
Aadir retardos de la variable dependiente y/o de las variables exgenas como regresores al estimar n o por MCO Modelo M nimos Cuadrados Ordinarios En la ventana de gretl: especicar modelo elegir la variable dependiente y aadir las variables n exgenas corrientes, en el mismo t. Entonces se ve remarcada la opcin de Retardos. Al elegir con o o el botn izquierdo aparece una ventana orden de retardos. o Si se quieren incluir retardos, por ejemplo de RD del 0 al 4 se especica en la parte izquierda de la caja al lado de la variable correspondiente. En este caso el modelo especicado ser a P AT EN T St = b1 + b2RDt + b3RDt1 + b4RDt2 + b5RDt3 + b6RDt4 + ut Donde t = 5, . . . , T , se pierden 4 observaciones del total T disponible al denir RDt4 . Si solamente se quiere incluir el cuarto retardo adems de RDt , esto es, el modelo: a P AT EN T St = b1 + b2RDt + b3RDt4 + ut Entonces se elige la casilla de retardos espec cos y se escribe en la caja correspondiente para ello los valores 0, 4. Si se quiere aadir al modelo retardos de la variable endgena como regresores en la ventana de orden n o de retardos se marca la opcin Retardos de la variable dependiente. De igual forma si se quieren o introducir un continuo de retardos del 1 al 2 por ejemplo se seleccionan en la parte izquierda el intervalo de valores. P AT EN T St = b1 + b2RDt + b3RDt4 + b4P AT EN T St1 + b5P AT EN T St2 + ut Si son retardos de la variable dependiente alternos, se selecciona la ventana retardos espec cos y se indica cuales en concreto, por ejemplo 1,3 introduce como regresores P AT EN T St1 y P AT EN T St3 pero no introduce el segundo retardo. P AT EN T St = b1 + b2RDt + b3RDt4 + b4P AT EN T St1 + b5P AT EN T St3 + ut Aadir retardos al estimar por Variables Instrumentales tanto en los regresores como en la lista n de instrumentos. Modelo Otros modelos lineales M nimos Cuadrados en dos etapas En la ventana gretl: especicar modelo tenemos que elegir la variable dependiente, las variables explicativas en t o corrientes y los instrumentos que estarn en la lista en t. a Se pulsa en retardos y aparece una ventana donde se tienen que seleccionar los retardos de las variables que aparecen en el modelo como regresores, tanto de variables exgenas como de la dependiente o y tambin las variables que vamos a usar como instrumentos. e 263
SARRIKO-ON 04/10
Anlisis de datos a
264
Tema 6
Gu para el desarrollo de un proyecto a emp rico

6.1. Caracter sticas bsicas del proyecto a
Esta seccin desarrolla una gu bsica para estructurar la realizacin de un proyecto. Es del todo o a a o recomendable la lectura del Cap tulo 19 del libro Introducin a la Econometr de Wooldridge, J. M. o a, (2003), que aparece en las referencias bibliogrcas. Los seminarios y tutor personalizadas de los a as equipos individuales servirn para marcar el ritmo en la evolucin del proyecto y para que el profesor a o tutorice tanto al equipo como individualmente a cada uno de los integrantes en su aprendizaje. No hay que perder de vista que el proyecto debe de contribuir a obtener las competencias espec cas de la asignatura en su totalidad aunque se incida en la cuarta en cuanto a su evaluacin. o Estructura bsica del trabajo: a 1. Portada: T tulo del trabajo y nombres y apellidos del autor/autores. 2. Introduccin: Presenta la motivacin principal del trabajo, el problema a analizar y o o posibles referentes en la literatura econmica. Por ejemplo, puede ayudar plantearse una o pregunta, muy concreta, sobre un fenmeno econmico. Por ejemplo, como afecta a la o o oferta laboral femenina y casada el nivel salarial, la educacin y/o el nmero de hijos? o u 3. Revisin de la bibliograf En muchas ocasiones existe literatura en el tema elegido. o a: Si es as debe de ser incluida, en un resumen breve. 4. Datos: Se describen los datos que componen la muestra a utilizar y las fuentes de donde han sido obtenidos. Se describen las variables a utilizar en el modelo junto con las unidades de medida. Finalmente se realiza un anlisis descriptivo bsico. a a 5. Modelo: Se introduce el modelo de partida propuesto, las variables que entran en el modelo, el signo esperado de los coecientes. Tambin si hay diferentes alternativas a la e especicacin propuesta que se quieran contrastar o analizar. o Es claro que el modelo inicial evolucionar a lo largo del trabajo. Por lo tanto en el a trabajo y la exposicin se debe mostrar los puntos ms importantes de esta evolucin, o a o sin ser exhaustivos en la repeticin de interpretacin de signos y coecientes. o o 265
SARRIKO-ON 04/10
Anlisis de datos a
6. Resultados emp ricos: Se muestran y explican razonadamente los resultados obtenidos aplicando las tcnicas vistas en clase que se crean oportunas: anlisis de residuos, e a contrastes sobre las hiptesis bsicas, eleccin de mtodos alternativos de estimacin y o a o e o realizacin de contrastes sobre los parmetros de inters del modelo. Al nal del trabajo o a e se crea un apndice en el que incluyen todos los outputs de gretl y grcos que se hayan e a obtenido a lo largo de todo el trabajo. 7. Conclusiones: Por ultimo, al nal del trabajo, se redactan las conclusiones del trabajo, teniendo en cuenta su objetivo y la especicacin y estimacin del modelo despus del o o e anlisis economtrico. En esta seccin se explica lo realizado en conjunto y se razona si a e o es el caso sobre la especicacin nal elegida. Este apartado es imprescindible. o 8. Bibliograf Recoge las referencias completas citadas a lo largo del texto. Fuentes de a: consultas bibliogrcas y de datos, as como referencias a pginas web si es que se utilizan. a a Cronolog El proyecto debe evolucionar a lo largo del curso, no debe ser un trabajo realizado a: en los ultimos diez d antes de su exposicin pblica por ello es importante que los equipos se as o u marquen una cronolog de acuerdo a las directrices marcadas en lo seminarios que se lleven a a cabo en el aula. Como ya se ha indicado los seminarios y tutor personalizadas de los equipos as servirn para marcar el ritmo en la evolucin del proyecto y para que el profesor tutorice tanto a o al equipo como individualmente a cada uno de los integrantes en su aprendizaje. No hay que perder de vista que el proyecto debe de contribuir a obtener las competencias espec cas de la asignatura en su totalidad aunque se incida en la cuarta en cuanto a su evaluacin. o Exposicin: En general el formato de la exposicin puede ser elegido libremente, transpao o rencias, power point etc. Habr de tenerse en cuenta que todos los alumnos intervienen en a la exposicin y que el profesor realizar preguntas a los miembros del grupo sobre el trabajo o a realizado. Datos a utilizar: Los que se quieran, siempre y cuando se reera la referencia en el trabajo de la fuente utilizada. 1. Se pueden utilizar datos de los cheros disponibles en Gretl siempre y cuando el trabajo no sea replicar un ejercicio que ya est en estos libros. e 2. Bases de datos disponibles en Gretl sobre servidor Archivo Bases de datos sobre servidor 3. Bases de datos disponibles en Biblioteca. 4. Otras direcciones de inters y bases de datos: e Eurostat: http://epp.eurostat.cec.eu.int/ Banco Mundial: http://devdata.worldbank.org/ Fondo Monetario Internacional: http://www.imf.org/ OCDE: http://www.oecd.org/ Banco Central Europeo: http://www.ecb.int/ Economic and Social Data Services: Gu a Recursos internacionales de datos de libre a acceso, http://www.esds.ac.uk/international/access/access.asp 266
Anlisis de datos a Banco de Espaa: http://www.bde.es/ n Instituto Nacional de Estad stica: http://www.ine.es/ Eustat: http://www.eustat.es/ Algunos consejos para la preparacin del trabajo: o
SARRIKO-ON 04/10
1. Primero es importante pensar en el modelo o relacin bsica que se quiere analizar junto o a con los datos a emplear. Es aconsejable estudiar previamente los datos de las variables que entran en el modelo, sus estad sticos descriptivos, grcos etc. a 2. Tambin es importante la forma de presentar los resultados. Una vez realizados los die versos anlisis, estimaciones etc., se pone en comn todos los resultados y se selecciona a u lo importante. Una vez elegido lo ms relevante de todo lo realizado esta informacin se a o presenta de forma que sea fcil comparar y valorar los resultados obtenidos. a 3. No mezclar diferentes fuentes y tipos de letra en el texto. 4. No utilizar abreviaciones coloquiales, tipo SMS. 5. Todas las guras y tablas deben estar numeradas. Aadir una pequea leyenda tanto a n n los grcos como a las tablas explicando que recogen (por ejemplo, Figura 2: Grco de a a los residuos contra el tiempo). Se puede poner arriba o abajo de la gura pero siempre hacerlo de la misma forma. 6. Las guras y tablas tambin pueden ir en un apndice y hacer referencia en el texto con e e la numeracin utilizada. o 7. Numerar todas las pginas. a 8. Es recomendable que se revisen las distintas versiones del trabajo antes de su presentacin, cuidando que no haya errores gramaticales. o Cmo presentar y comparar resultados: o A continuacin se va a mostrar la presentacin de resultados de tres especicaciones alternao o tivas y tres mtodos de estimacin como gu de presentacin de resultados. e o a o Vamos a estimar las siguientes especicaciones o modelos alternativos para explicar el precio de la vivienda: Modelo A Modelo B Modelo C P RICEi = 1 + 2 SQF Ti + ui P RICEi = 1 + 2 SQF Ti + 3 BEDRM Si + ui P RICEi = 1 + 3 BEDRM Si + 4 BAT HSi + ui
Estos tres modelos dieren en las variables explicativas incluidas. La Tabla 6.1 muestra los coecientes estimados por MCO y distintos estad sticos asociados a la cuatro especicaciones o modelos alternativos anteriores. Esta forma de presentar los resultados puede estar ms indicada cuando, como ahora, se presentan distintas especicacioa nes con la misma variable dependiente. En la parte de abajo de la tabla, tambin para cada e una de las especicaciones, podis incluir los valores muestrales de los estad e sticos de diversos 267
SARRIKO-ON 04/10
Anlisis de datos a
Tabla 6.1: Modelos estimados para el precio de la vivienda P RICE Variable CONSTANT SQFT BEDRMS BATHS Variable dependiente: P RICE Modelo A Modelo B 52,351 121,179 (1,404) (1,511) 0,13875 0,14831 (7,407) (6,993) -23,911 (-0,970) Modelo C 27,2633 (0,182)
-10,1374 (-0,216) 138,795 (2,652) 55926,4 0,450706 0,350834 4,51285 11
Suma de cuadrados residual R2 R2 F de signicacin conjunta o Grados de libertad
18273,6 0,821 0,806 54,861 12
16832,8 0,835 0,805 27,767 11
Los valores entre parntesis son los correspondientes estad e sticos t de signicatividad individual sin tener en cuenta la posible heterocedasticidad y o autocorrelacin. o
contrastes bien de heterocedasticidad, autocorrelacin etc. si los habis realizado para cada o e modelo estimado. Si se considera estimar por distintos mtodos la misma especicacin, puede ayudar presentar e o los resultados como en la Tabla 6.2: Tabla 6.2: Funcin de Salarios o Variable dependiente: Salarios Privados W p Explicativas MCO Cochrane-Orcutt Hildreth-Lu const 1, 497 1, 5 1, 53 (1, 27) (1, 27) (1, 32) Xt 0, 439 0, 439 0, 434 (0, 032) (0, 039) (0, 075) Xt1 0, 146 0, 147 0, 151 (0, 037) (0, 043) (0, 074) 0, 13 0, 13 0, 132 At (0, 032) (0, 032) (0, 035)
Entre parntesis se muestran las desviaciones t e picas estimadas. En el caso de MCO son robustas a autocorrelacin. o El s mbolo denota que es signicativo al 5 %. El tamao muestral es T = 80 datos trimestrales. n
De esta forma es ms fcil comparar los resultados a la vez que mostrarlos en una transparencia a a a la hora de la presentacin. o
268
Bibliograf a
Referencias Bibliogrcas Bsicas: a a
Terica: o [1] Greene, W. (1998), Anlisis Economtrico, ed. Prentice Hall, 3a edition. a e [2] Ramanathan, R. (2002), Introductory Econometrics with applications, ed. South-Western, 5th edition. [3] Wooldridge, J. M. (2003), Introductory Econometrics: A modern Approach, ed. South-Western, 2nd edition. Ejercicios: [1] Alegre, J., Arcarons, J., Bolanc, C. y D L. (1995), Ejercicios y Problemas de Econometr e az, a, Coleccin Plan Nuevo, ediciones AC. o [2] Fernndez, A., Gonzlez, P., Reglez, M., Moral, P., Esteban, V. (2005), Ejercicios de Econoa a u a edicin. metr ed. McGraw-Hill, 2 a, o [3] Recopilacin de ejercicios recomendados y exmenes de Econometr Departamento de Econom o a a. a Aplicada III (Econometr y Estad a stica). Mimeo Febrero 2010. Ejercicios con gretl: [1] Ramanathan, R. (2002), Instructors Manual to accompany, del libro Introductory Econometrics with applications, ed. South-Western, 5th edition, Harcourt College Publishers. [2] Wooldridge, J. M. (2003), Student Solutions Manual, del libro Introductory Econometrics: A modern Approach, ed. South-Western, 2nd edition.
269
SARRIKO-ON 04/10
Anlisis de datos a
Referencias Bibliogrcas Complementarias: a

[1] Alonso, A., Fernndez, J. y Gallastegui, I. (2005), Econometr ed. Pearson: Prentice Hall. a a, [2] Breusch, T. S. y Pagan, A. R. (1979), A Simple Test for Heteroscedasticity and Random Coefcient Variation, Econometrica, 47, pp. 1287-1294. [3] Dougherty, Ch. (2006), Introduction to Econometrics, 3rd. Ed., Oxford University Press. [4] Goldfeld, S. M. y Quandt, R. E. (1965), Some Test for Homoscedasticity, Journal of the American Statistical Association, 60, pp. 539-547. [5] Gujarati, D. (2004), Econometr ed. McGraw-Hill, 4a edicin. a, o [6] Harvey, A., y Phillips, G. (1974), A Comparison of the Power of Some Test for Heteroscedasticity in the General Linear Model, Journal of Econometrics, 2, pp. 307-316. [7] Johnston, J. (1984), Mtodos de Econometr ed. Vicens Vivens, 4a edicin. e a, o [8] Maddala, G. S. (1996), Introduccin a la Econometr ed. Pearson: Prentice Hall. o a, [9] Novales, A. (1993), Econometr ed. McGraw-Hill, 2a edicin. a, o [10] Pindyck, R.S. y Rubinfeld, D.L. (1998), Econometric Models and Economic Forecast, ed. McGraw-Hill, 4a edicin. o [11] White, H. (1980), A heteroskedasticity-Consistent Covariance Matrix Estimator and a Direct Test for Heteroskedasticity, Econometrica, 48, pp. 817-838.
270
Apndice: Tablas de datos e

Datos sobre Consumo y Renta. Ejemplo magistral del Tema 2: Heterocedasticidad.
Tabla A.3: Observaciones de Consumo y Renta Observacin o i= i= i= i= i= i= i= i= i= i= i= i= i= i= i= i= i= i= i= i= 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Consumo 52,25 58,32 81,79 119,90 125,80 100,46 121,51 100,08 127,75 104,94 107,48 98,48 181,21 122,23 129,57 92,84 117,92 82,13 182,28 139,13 Renta 258,3 343,1 425,0 467,5 482,9 487,7 496,5 519,4 543,3 548,7 564,6 588,3 591,3 607,3 611,2 631 659,6 664,0 704,2 704,8 Observacin o i= i= i= i= i= i= i= i= i= i= i= i= i= i= i= i= i= i= i= i= 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Consumo 98,14 123,94 126,31 146,47 115,98 207,23 119,80 151,33 169,51 108,03 168,90 227,11 84,94 98,70 141,06 215,40 112,89 166,25 115,43 269,03 Renta 719,8 720,0 722,3 722,3 734,4 742,5 747,7 763,3 810,2 818,5 825,6 833,3 834,0 918,1 918,1 929,6 951,7 1014,0 1141,3 1154,6
271
SARRIKO-ON 04/10
Anlisis de datos a
Tabla A.4: Datos de la empresa Lydia Pinkham (1907-1960)

A o n Vt Gt A o n Vt Gt A o n Vt Gt A o n Vt Gt A o n Vt Gt 1907 1016 6,08 1920 2203 8,66 1933 1518 8,07 1946 1910 9,41 1959 1387 6,44 1908 921 4,51 1921 2514 10,16 1934 1103 3,39 1947 1814 14,53 1960 1289 5,64 1909 934 5,29 1922 2726 13,60 1935 1266 5,62 1948 1770 15,04 1910 976 5,43 1923 3185 14,48 1936 1473 7,45 1949 1984 9,81 1911 930 5,25 1924 3351 16,08 1937 1423 7,49 1950 1787 9,74 1912 1052 5,49 1925 3438 18,00 1938 1767 8,62 1951 1689 7,66 1913 1184 5,25 1926 2917 19,41 1939 2161 10,34 1952 1866 9,20 1914 1089 5,78 1927 2359 12,29 1940 2336 10,54 1953 1896 9,64 1915 1087 6,09 1928 2240 13,73 1941 2602 11,64 1954 1684 8,11 1916 1154 5,04 1929 2196 16,11 1942 2518 11,02 1955 1633 7,89 1917 1330 7,52 1930 2111 15,68 1943 2637 11,45 1956 1657 8,02 1918 1980 6,13 1931 1806 9,83 1944 2177 10,12 1957 1569 7,70 1919 2223 8,62 1932 1644 10,46 1945 1920 8,36 1958 1390 6,39
Vt : ventas de la empresa medidos en miles de dlares. Gt : gastos en publicidad medidos en cientos de miles de dlares. o o Fuente: Palda, K. S. (1964), The measurement of cumulative adversing eects, Englewood Clis, N. J. Prentice-Hall.
272

04 10

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

04 10

Caricato da

Copyright:

Formati disponibili

Anlisis de datos: un enfoque economtrico

Maria Victoria Esteban Gonzlez Marta Reglez Castillo

Anlisis de datos: un enfoque economtrico a e

Autores: M. Victoria Esteban Gonzalez Marta Reglez Castillo u

Las competencias espec cas de la asignatura y la evaluacin o

2.7. Consumo versus Renta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8. Residuos MCO versus Renta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

3.2. Proceso AR(1) con = 0, 95 3.3. Proceso AR(1) con = 0, 95

Propiedades de un estimador. Muestras nitas versus muestras grandes

lim P r{|T | < } = 1

Este teorema se corresponde con la Proposicin 2.16 Novales pp. 41. o

El Modelo de Regresin Lineal General. Estimador M o nimo Cuadrtico Ordinario (MCO) a

Escribimos el Modelo de Regresin Lineal General: o Yt = 1 X1t + 2 X2t + . . . + K XKt + ut t = 1, 2, . . . , T Yt = Xt + ut (1)

1 X21 1 X22 1 X23 . . . . . . 1 X2T

X31 X32 X33 . . . X3T

. . . XK1 . . . XK2 . . . XK3 . .. . . . . . . XKT X

En el Modelo de Regresin Lineal General: o Y = X + u

SARRIKO-ON 04/10 Propiedades en muestras nitas:

En el Modelo de Regresin Lineal General: o Y = X + u

Anlisis de datos a Ejemplo 0.2 En el Modelo de Regresin Lineal General: o Y = X + u

= Q1 E(Z) = 0. = E((Q1 Z)(Q1 Z) ) = Q1 E(ZZ )Q1 = Q1 ( 2 Q)Q1 = 2 Q1 QQ1 = 2 Q1 .

c. Si T entonces el sesgo se hace nulo:

Adems ECM () = 2 (X X)1 + a

> 2 (X X)1 = ECM (M CO ).

En el Modelo de Regresin Lineal General: o Y = X + u

(R r) [ R(X X)1 R ]1 (R r)/q H0 F(q,T K) 2

Si q = 1 podemos escribir los estad sticos y distribuciones anteriores como: ( R r) R V ()R

i,M CO H0 t(T K) aii

Qu vamos a aprender en este curso? e

Ejercicios para practicar

Ejercicio 0.4 En el modelo Yt = 1 + 2 Xt + 3 Zt + ut 2 no estocsticas y ut iid(0, u ). se pide: a

Anlisis de datos a 2. Obtener su distribucin asinttica. o o 3. Indica como contrastar H0 : 2 = 3 as

X1t , X2t no estocsticas t, ut iid(0, 2 ). Pero especicamos el modelo: a Yt = 1 + 2 X1t + vt t = 1, 2, . . . , T

t = 1, 2, . . . , T es una serie no aleatoria tal que c= 1 T

Anexo: Demostracin de la consistencia del estimador MCO o

luego M CO es un estimador asintticamente insesgado. o a.2) V ar() = 2 (X X)1 =

y se satisface para cualquier T dado si u N (0, 2 I). 2 T

lim V ar() = lim

SARRIKO-ON 04/10 Sabemos que: plim

por (1) y (2) plim y por tanto 1 Xu T =0

luego M CO es un estimador consistente.

M nimos Cuadrados Generalizados

Modelo de regresin con perturbaciones no esfricas o e

SARRIKO-ON 04/10 donde

= (N1 +N2 )(N1 +N2 )

Propiedades del estimador de MCO

= Q nita, denida positiva = Z nita, denida positiva

lim E(M CO ) = lim 2 T XX T

= 0 Q1 Z Q1 = 0, por lo que el estimador es consistente: plim M CO = .

Estimador de la matriz de varianzas y covarianzas de M CO

Mtodo de M e nimos Cuadrados Generalizados (MCG)

Propiedades del estimador de MCG

lim E(M CG ) = lim V(M CG ) = lim 2 T X 1 X T

luego plim M CG = , con lo que el estimador es consistente. 29

SARRIKO-ON 04/10 Distribucin Asinttica: Dado que o o plim M CG = = M CG = (M CG ) 0

Entonces se cumplen los dos resultados siguientes: 1. plim X u T =0

por lo que de Mann-Wald, y utilizando el teorema de Cramer, tenemos

de donde T (M CG ) = con G = plim X

Estimador de la matriz de varianzas y covarianzas de M CG

Anlisis de datos a siendo M CG = 2

Mtodo de M e nimos Cuadrados Generalizados Factibles (MCGF)

Propiedades del estimador de MCGF

Estimador de la matriz de varianzas y covarianzas de M CGF