Sei sulla pagina 1di 33

APUNTES

ECONOMETR A

Unin de Estudiantes de Ciencias Econmicas | AECUC3M

Unin de Estudiantes de Ciencias Econmicas

Tema 1 Modelizaci y Datos Econom n tricos


Concepto de Modelo Econom trico La Econometr se basa en el desarrollo de m a todos estad sticos destinados a estimar las relaciones econ micas. La Econometr se centra en los problemas inherentes a la recopilaci y al an a n lisis de datos econ micos no experimentales. La Econometr es una rama de la Estad a stica basada en el planteamiento de modelos que relacionen variables econ micas. Uno de los objetivos principales de la Econometr es realizar an a lisis causal, que permite determinar los efectos de ciertas pol ticas; y caracterizar y cuantificar la relaci de n comportamiento entre variables econ micas. Las variables: 1. Variables observacionales: Son aquellas que se pueden medir. a) Variable Dependiente: Es aquella que tratamos de explicar. b) Variable Independiente: Es aquella que explica o causa a la variable dependiente. Dicho de otra forma, la variable dependiente estarcausada por las variables independientes. y Variable dependiente Variable explicada Variable respuesta Variable predicha Regresando x Variable independiente Variable explicativa Variable de control Variable predictor Regresor

Concepto de Econometr a

Componentes del modelo econom trico

2. Variables no observacionales: Son aquellas que no se pueden medir por estar contenidas en el t rmino de error. Los Par metros: Si est contenidos en la ecuaci del modelo, se llamar par n n n metros estructurales. Los Datos: 1. Datos de Secci Cruzada o Corte Transversal: n a) Definici Son conjuntos de observaciones de una o m variables medidas en n: s distintas unidades econ micas. b) Ejemplo: Salario de un grupo de trabajadores de una empresa; Ventas de un conjunto de empresas en 2009, etc. 2. Datos de Serie Temporal: a) Definici Son conjuntos de observaciones de una o m variables medidas a lo n: s largo del tiempo en per odos regulares. b) Ejemplos: El IPC mensual, el crecimiento del PIB trimestral,etc. 3. Datos de Panel:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


a) Definici Son conjunto de observaciones de una co m variables medidas en n: s distintas unidades econ micas, en dos per odos distintos de tiempo, entre los que se produce un cambio estructural. b) Ejemplo: Medimos el precio de un conjunto de viviendas antes y despu de s construir un verdadero pr ximo. Propiedades de las Esperanzas, Covarianzas ,Varianzas, Sumatorios y L mites Probabil sticos Propiedades de las Esperanzas Propiedades de las Varianzas Propiedades de las Covarianzas La suma del producto de una constante por una variable, es igual a k veces la sumatoria de la variable.

Propiedades de los Sumatorios

El sumatorio hasta N de una constante, es igual a N veces la constante.

El sumatorio de una suma es igual a la suma de las sumatorias de cada t rmino.

El sumatorio de un producto no es igual al producto de las sumatorias de cada t rmino.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


El sumatorio de los cuadrados de los valores de una variable no es igual a la sumatoria de la variable elevado al cuadrado.

Aplicaci de las propiedades de los Sumatorios: n 1. C lculo de la Varianza de X:

2. C lculo de la Covarianza entre X e Y:

Propiedades de L mites Probabil sticos

El l mite probabil stico de un constante es igual al constante.

El l mite probabil stico del producto de un constante por una variable es igual al constante por el l mite probabil de la variable. tico

El l mite probabil stico de una suma o resta de dos variables es igual a la suma o resta de l mites probabil sticos de las dos variables.

El l mite probabil stico de un producto entre dos variables es igual al producto de los l mites probabil sticos de las dos variables.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

El l mite probabil stico de un cociente entre dos variables es igual al cociente de los l mites probabil sticos de las dos variables.

Introducci n

Efecto Causal

Concepto de Esperanza Condicionada y Causalidad CETERIS PARIBUS El objetivo de los modelos econom tricos es predecir Y en funci de X. n Dando por hecho que entr ambas variables existe una relaci de causalidad, es decir, que Y est n causada por X puede demostrarse que la mejor predicci de Y en funci de X es la Esperanza n n de Y condicionada a X, E(Y/X), o Esperanza Condicional. Tambi se le conoce como Funci n n de Regresi Poblacional. n El objetivo de los economistas es inferir si una variable tiene un efecto causal sobre otras variables. Para obtener este efecto causal, debemos aislar el efecto de las otras variables influyentes en el salario. Esto es lo que se conoce como causalidad CETERIS PARIBUS, es decir, mantenemos constantes el resto de variables influyentes en Y.

Propiedades de las Esperanzas Condicionadas

Suponemos que Z=g(X) Suponemos que Z=a+bX+cY Ley de Esperanzas Iteradas: Descomposici de la Varianza Marginal: n

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Tema 2

Modelo de Regresi Lineal Simple n


Concepto y Tipos de Predicci n El objetivo del Modelo de Regresi Lineal Simple es predecir la variable dependiente Y, n utilizando la informaci de la variable independiente X. n El concepto de predicci consiste en elaborar una predicci c(X), al ser una funci de x. n n n Evidentemente cometeremos un error de predicci (u), que serla diferencia entre el valor real n de Y y nuestra predicci c(X): n Como el error de predicci (u) puede ser positivo, negativo o nulo, para asegurarnos de que n siempre obtengamos magnitudes positivas, definimos el Error Cuadr Medio de la Predicci tico n ECM (u): Nuestro objetivo es encontrar la predicci c(X) que haga que el ECM (u) sea m n nimo. Mejor Predicci Constante: n a) Supuesto: No conocemos la informaci de la variable X y la funci c(X)=c n n b) Minimizando esta funci obtenemos la mejor predicci constante de la variable Y. n, n c) Predictor: La media poblacional es el mejor predictor constante de la variable Y. Mejor Predicci Lineal: n a) Supuesto: Conocemos la variable X para predecir la variable Y, y la funci c(X) es de tipo n lineal, de tal manera que . b) Minimizando este error cuadr medio, obtenemos la mejor predicci lineal, y la tico n llamamos Proyecci Lineal de Y/X o Predictor Lineal ptimo de Y/X. n

Concepto

Tipos de Predicci n

La Mejor Predicci n: a) Supuesto: Conocemos la variable X antes de hacer la predicci de la variable Y. En este caso, n la funci c(X) puede ser lineal o no lineal, pero en general es desconocida. n b) Minimizando esta funci obtenemos la mejor predicci de la variable Y, que serla n, n Esperanza de Y condicionada a X, E(Y/X), o Funci de Esperanza Condicional. n c) Si E(Y/X) es Lineal, entonces coincidircon la proyecci lineal: n

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


d) Si E(Y/X) no es lineal, entonces no coincidircon la proyecci lineal. n

Supuestos del Modelo de Regresi Lineal Simple n Linealidad en los Par metros del Modelo Esto quiere decir, que el modelo serlineal si los par metros ( son lineales. Por lo tanto, un modelo puede no ser lineal en variables, pero s es en per lo metros, se considerarque cumple este supuesto. Suponemos que , donde es el t rmino de error o peturbaci y es una variable n, aleatoria que recoge el efecto de las variables explicativas no incluidas en el modelo. Implicaciones del Supuesto: 1. Se cumple que . 2. La , Incorrelaci entre X y , tambi se puede decir que X es ex n n geno. 3. La funci de Esperanza condicional serlineal, es decir, n Supone que la Varianza Condicionada del Error es Constante e igual a . Implicaciones del Supuesto: 1. 2. Estimaci del Modelo: M n nimos Cuadrados Ordinarios Las expresiones que se cumplen en t rminos muestrales tambi se cumplir en t n n rminos poblacionales (y viceversa). POBLACIONAL MUESTRAL

Homocedastici dad

Principio de Analog a

Condiciones de Primer Orden para las Estimaciones MCO

Las condiciones de primer orden para las estimaciones MCO es una expresi que viene del n c lculo de optimizaci n. La expresi M n nimos Cuadrados Ordinarios viene del hecho de que estos valores estimados minimizan la suma de los cuadrados de los residuos. Minimizar la Suma de los Cuadrados de los Residuos: Dado que , por lo que Nuestro objetivo es minimizar la suma de los residuos al cuadrado, es decir:

Una condici necesaria para que n

sean soluciones del problema de minimizaci es n

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


que las dedivadas parciales de la funci sea igual a 0. n

Propiedades Algebraicas de los Estimadores MCO

Por lo tanto observamos que para que sea un estimador ptimo, la condici es que n , y para que sea un estimador ptimo, la condici es que n . Y estas dos condiciones son las dos implicaciones de uno de los supuestos del MRLS: y . La suma, y por lo tanto, la media muestral de los residuos MCO es nula:

Esta propiedad deriva directamente de la condici de primer orden de los MCO. n La Covarianza muestral entre los regresores y los residuos MCO es nula:

El punto

siempre estsobre la recta de regresi MCO, es decir n

Estimaci de n la varianza del error

Aplicando las propiedades anteriores, observamos que , y dado que , por lo tanto, . Distinci entre los errores y los residuos: n Los errores nunca son observables, y aparecen en la ecuaci que contiene los par n metros poblacionales: Los residuos se calculan a partir de los datos, y aparecen en la ecuaci estimada: n

Estimaci de la varianza del error: n Luego, un estimador de ser a:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Sin embargo, este estimador tiene un sesgo, porque no considera las restricciones que los residuos MCO deben satisfacer. Estas restricciones vienen dadas por las dos condiciones de primer orden del estimador MCO: y . Un estimador insesgado de ser a:

Teorema de Gauss-Markov Linealidad

Propiedades de los Estimadores MCO De entre todos los estimadores, los estimadores MCO son lineales, insesgados y tienen varianza m nima, es decir, que son ptimos. Significa que y son en realidad, funciones lineales de Y.

Insesgadez

Decimos que un estimador es insesgado o centrado cuando su esperanza es igual al par metro que estimamos.

Varianza m nima

Puede demostrarse que y estimadores m eficientes. s

de MCO tienen m nima varianza, y por tanto, ser los n

Consistencia

Los estimadores y son estimadores consistentes si a medida que se incrementa el tama o muestral, su valor se aproxima al verdadero par metro poblacional. En t rminos econom tricos, la consistencia equivale a convergencia en probabilidad.

Introducci n

Interpretaci de los coeficientes n Al plantear cualquier modelo de regresi nuestro objetivo es interpretar el efecto de x sobre y. n, Para que los par metros de un modelo puedan interpretarse, el modelo tiene que ser lineal en par metros. Como vimos, la condici para que el modelo sea lineal era el cumplimiento del n . Esto viene a significar que, si ,entonces los par metros no tendr interpretaci n n. Concepto de Variaci Absoluta, Variaci Relativa y Variaci Porcentual: n n n Ejemplo: Supongamos que el salario de un individuo (x) al mes son 2000, y su salario se incrementa hasta 2500. Vamos a calcular la variacin absoluta, relativa y porcentual del salario: Variaci Absoluta: n

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Variaci Relativa: n

Variaci Porcentual: n

Concepto de Elasticidad y Semielasticida d Modelo Lineal

Elasticidad: Cuando las 2 variables est expresados en funci de Ln. n n Semielasticidad: Cuando s 1 de las variables se ve afectado por Ln. lo

Interpretaci de n

Ante un incremento de 1 unidad en X, le corresponde en promedio una variaci de n en Y. Elasticidad de Y con respecto a X:

unidades

En este modelo, la elasticidad no es constante, puesto que depende de los valores de X e Y. Modelo Logar tmico-Li neal Interpretaci de n :

Ante un incremento de 1 unidad en X, le corresponde en promedio una variaci de n puntos porcentuales en Y. Elasticidad de Y con respecto a X:

En este modelo, la elasticidad no es constante, puesto que depende del valor de X. Modelo Lineal-Logar t mico Interpretaci de n :

Ante un incremento de 1 punto porcentual en X, le corresponde en promedio una variaci de n unidades en Y. Elasticidad de Y con respecto a X:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

En este modelo, la elasticidad no es constante, puesto que depende del valor de Y. Modelo Doble Logar tmico Interpretaci de n :

Ante un incremento de 1 punto porcentual en X, le corresponde en promedio una variaci de n puntos porcentuales en Y. Elasticidad de Y con respecto a X:

Unidades de Medida

En este modelo, la elasticidad es constante. Los estimadores MCO cambian en una forma totalmente previsible cuando se modifican las unidades de medida de las variables dependientes e independientes. Si la variable dependiente (Y) se multiplica por la constante c, entonces los valores estimados MCO del t rmino constante y de la pendiente tambi se multiplican por c. n Si la variable independiente (X) se divide o se multiplica por una constante no nula, c , entonces el coeficiente de la pendiente MCO se multiplica o se divide por c, respectivamente. El cambio s en las unidades de medida de la variable independiente no afecta al t lo rmino constante. Bondad de Ajuste Suma de Cuadrados Total (SCT): SCT=SCM+SCE

Suma de Cuadrados

Suma de Cuadrados del Modelo (SCM):

Suma de Cuadrados de los residuos (SCE):

R-cuadrado

Es una forma de medir la capacidad de la variable independiente o explicativa X de explicar la variable dependiente. R-cuadrado es la proporci de la variaci explicada en comparaci con la variaci total. n n n n

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Se interpreta como la fracci de la variaci muestral en Y que viene explicada por X. n n 100* es el porcentaje de la variaci muestral de Y que viene explicada por X. n

tambi es igual al cuadrado del coeficiente de correlaci muestral entre n n

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Tema 3

Modelo de Regresi M n ltiple


Modelo con k variables explicativas Linealidad en los par metros: Esto quiere decir, que el modelo serlineal si los par metros ( son lineales. Por lo tanto, un modelo puede no ser lineal en variables, pero s es en per lo metros, se considerar que cumple este supuesto. : Se trata de un supuesto fundamental del modelo y tiene las siguientes implicaciones: 4. Se cumple que . 5. La , Incorrelaci entre n y . 6. La funci de Esperanza condicional serlineal, es decir: n Homocedasticidad: Supone que la Varianza Condicionada del Error es Constante e igual a

Supuestos del Modelo de Regresi n M ltiple

Implicaciones del Supuesto: 3. 4. No Colinealidad Perfecta: Supone que no existe ninguna combinaci lineal exacta entre variables explicativas, porque si n existiese, el modelo presentar multicolinealidad o Colinealidad y no podrestimarse. a Es importante tener en cuenta que el supuesto s permite que las variables independientes est n correlacionadas, lo que no pueden es estar perfectamente correlacionadas. Ejemplos de combinaciones exactas de variables:

Modelo con dos variables explicativas

Un caso especialmente importante en este modelo es el caso de Incorrelaci entre n decir, . Por lo tanto:

, es

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Condici de n Primer Orden

Estimaci del Modelo de Regresi M n n ltiple: MCO Dado que , por lo que Nuestro objetivo es minimizar la suma de los residuos al cuadrado, es decir:

Una condici necesaria para que n y sean soluciones del problema de minimizaci es n que las dedivadas parciales de la funci sea igual a 0. n

Propiedades Algebraicas de los Estimadores MCO Interpretar la ecuaci de la n regresi n MCO para 2 variables

La media muestral de los residuos es cero. La Covarianza muestral entre cada variable independiente y los residuos MCO es cero, de lo que se desprende que la covarianza muestral entre los valores ajustados MCO y los residuos MCO es cero. El punto siempre estsobre la recta de regresi MCO. n Interpretaci de los Coeficientes en un Modelo de Regresi M n n ltiple El par metro del t rmino constante es el valor predicho de y cuando = =0. Siempre se necesita el par metro del t rmino constante para obtener una predicci de y a partir de la recta n de regresi MCO. n Los valores estimados y tienen interpretaciones de efecto parcial o ceteris paribus.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


independientes Cuando Cuando se mantiene fijo, de forma que se mantiene fijo, de forma que , entonces: , entonces:

Interpretar la ecuaci de la n regresi n MCO para m de 2 s variables independientes

Escrito en t rminos de cambios: El coeficiente de mide el cambio en por cada incremento en una unidad de manteniendo fijas las restantes variables independientes. ,

Formas Cuadr ticas

La utilidad del an lisis de regresi m n ltiple reside en que nos proporciona una interpretaci n ceteris paribus aun cuando los datos no hayan sido recogidos de una forma ceteris paribus. La utilidad del an lisis de regresi m n ltiple reside en que nos permite hacer en un medio no experimental lo que los cient ficos hacen en el medio controlado de un laboratorio: mantener fijos el resto de los factores. Cuando planteamos el modelo de regresi el primer supuesto que realizamos es la linealidad en n, los par metros. Sin embargo, las variables no tienen porquser lineales. Puede ocurrir que al plantear un modelo de regresi para recoger el efecto de alguna variable n explicativa, no baste con incluirla en forma lineal, sino que tengamos que incluir un t rmino cuadr tico. Cuando la variable contiene un t rmino cuadr tico, la interpretaci se realiza a partir de la n primera derivada del modelo:

Sustituyendo las derivadas por los incrementos:

T rminos de Interacci n

Interpretaci del efecto de la variable independiente n Ante un incremento de 1 unidad en , le corresponde una variaci en promedio de n unidades en Y, manteniendo el restos de variables independientes fijos. Por tanto, este efecto no es constante, y dependerdel valor que tome . Puede ocurrir que al plantear un modelo de regresi el efecto de una variable explicativa n, dependa de otras variables explicativas del modelo. Cuando esto ocurre, es necesario introducir t rminos de interacci n. Para obtener en este caso el efecto parcial ceteris paribus de derivada: , habrque plantear la siguiente

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Sustituyendo las derivadas por los incrementos:

Teorema de Gauss-Markov Linealidad Insesgadez

Interpretaci del efecto de la variable independiente n Ante un incremento de 1 unidad en , le corresponde una variaci en promedio de n unidades en Y, manteniendo el restos de variables independientes fijos. Por tanto, este efecto no es constante, y dependerdel valor que tome . Propiedades de los Estimadores de MCO: Teorema de Gauss-Markow De entre todos los estimadores, los estimadores MCO son lineales, insesgados y tienen varianza m nima, es decir, que son ptimos. Significa que Si se cumple el supuesto insesgados: se pueden expresar mediante una combinaci lineal de Y. n , entonces los estimadores MCO ser n

Varianza M nima

Se puede demostrar que los estimadores MCO tienen la menor varianza de entre todos los estimadores lineales e insesgados.

Donde regresi de n Consistencia

es la varianza muestral total de sobre el resto de las variables independientes.

,y

es el R-cuadrado de la

Los estimadores son estimadores consistentes si a medida que se incrementa el tama muestral, su valor se aproxima al verdadero par o metro poblacional. En t rminos econom tricos, la consistencia equivale a convergencia en probabilidad.

Inferencia en los Modelos de Regresi n Contraste de Hip tesis de un nico par metro poblacional Hip tesis nula: Interpretaci n: Contrastar que no tiene ning efecto sobre el valor esperado de Y. n Estad stico de Contraste:

1. Como

siempre es positivo,

tiene el mismo signo que

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


2. La estimaci puntual n nunca serexactamente igual a 0, sea o no cierta la hip tesis nula. La cuesti es saber a qudistancia est n de 0. 3. Estamos contrastando hip tesis sobre los par metros poblacionales. No estamos contrastando hip tesis sobre las estimaciones obtenidas de una muestra particular. 4. En Econometr todas las muestras son Asint a, ticas (n>30), y estos estad sticos convergen a una distribuci normal: n Contraste frente a alternativas unilaterales: 1. Bajo la hip tesis alternativa 2. Regla de Rechazo: , el valor esperado de es positivo.

, siendo c el valor cr tico.

3. Para grados de libertad mayores que 120, se pueden usar los valores cr ticos de la normal tipificada. 1. Bajo la hip tesis alternativa 2. Regla de Rechazo: , el valor esperado de , siendo c el valor cr tico. es negativo.

Contraste frente a alternativas bilaterales: 1. Bajo esta alternativa, positivo o negativo. 2. Regla de Rechazo: tiene un efecto ceteris paribus en Y, sin especificar si el efecto es

, siendo c el valor cr tico.

Interpretaci del Resultado de Contraste: n 1. Si se rechaza , decimos que es estad sticamente significativo. 2. Si no se rechaza , decimos que es estad sticamente no significativo. Contraste de otras hip tesis sobre :

C lculo de p-valores: El p-valor es el nivel de significatividad m peque al que se rechazar la hip s o a tesis nula. Intervalo de Confianza:

Contraste de Hip tesis acerca de una

Hip tesis nula:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


nica combinaci n lineal de los par metros Hip tesis Alternativa:

Estad stico de Contraste:

C lculo de

Otra forma de c lculo:

Sustituir Contraste de Restricciones Lineales M ltiples

en la regresi original y estimamos: n

Noci b n sica: 1. El contraste de Restricciones Lineales M ltiples se utiliza para contrastar si un conjunto de variables independientes no ejerce un efecto parcial sobre la variable dependiente. 2. Modelo No Restringido: Aquel modelo inicial que contiene todas las variables explicativas. 3. Modelo Restringido: Aquel modelo resultado de haber sustituido las hip tesis nulas en el modelo inicial. Contraste de Restricciones de Exclusi n: Modelo no restringido:

Hip tesis nulas y alternativas:

Modelo restingido:

Estad stico de Contraste:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Como no puede ser menor que , el estad stico F es siempre positivo. En Econometr todas las muestras son Asint a, ticas (n>30), y estos estad sticos convergen a una distribuci chi-cuadrado n :

Notaci n: q= n mero de restricciones de exclusi de n . k= n mero de variables explicativas del modelo no restringido. Interpretaci del Resultado de Contraste: n 1. Si se rechaza , decimos que son estad sticamente significativa de forma conjunta al nivel de significatividad adecuado. 2. Si no se rechaza , entonces las variables son conjuntamente no significativas. Relaci entre los estad n sticos t y F: Se puede demostrar que el estad stico F para contrastar la exclusi de una n nica variable es igual al cuadrado del estad stico t correspondiente. O bien,

La forma R-cuadrado del estad stico F: 1. Una raz para utilizar la forma de R-cuadrado se halla en que el R-cuadrado estsiempre n entre 0 y 1, mientras que las SCE pueden ser muy grandes dependiendo de las unidades de medida de Y. 2. Forma R-cuadrado del estad stico F:

En Econometr todas las muestras son Asint a, ticas (n>30), y estos estad sticos convergen a una distribuci chi-cuadrado n :

3. Como , esto demuestra de nuevo que el estad stico F siempre serpositivo. 4. Es importante no elevar al cuadrado el R-cuadrado antes de introducirlo en la f rmula, puesto que la elevaci al cuadrado ya se ha realizado. n El Estad stico F para la significatividad conjunta de una regresi n:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Modelo no restringido:

Hip tesis nulas y alternativas:

Modelo restingido:

Estad stico de Contraste:

En este caso, R-cuadrado de

es igual a 0.

Contraste de Restricciones Lineales Generales: Modelo no restringido:

Hip tesis nulas y alternativas:

Modelo restingido:

Estad stico de Contraste:

En este caso, el modelo restringido es un modelo con un t rmino constante, pero con una variable dependiente diferente de la del modelo no restingido. Por lo tanto, no podemos utilizar la forma R-cuadrado del estad stico F. Como Regla General, deber usarse la forma SCE del estad a stico F si la regresi restringida n presenta una variable dependiente distinta a la de la regresi no restringida. n

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Tema 4

Variables Binarias
Variables Binarias En la investigaci econom n trica suelen aparecer fen menos de discriminaci por raz de n n sexo, raza, nivel de estudios, lugar de residencia, etc, que no pueden analizarse utilizando nicamente variables cuantitativas. Para analizar estos fen menos discriminatorios, necesitaremos introducir informaci cualitativa n en los modelos. Las variables cualitativas se introducen en los modelos mediante variables binarias, ficticias o dummies. Se trata de variables que toman nicamente dos valores: 1. Valor 1: Cuando el individuo o el elemento analizado cumpla una determinada caracter stica. 2. Valor 0: Cuando el elemento o individuo analizado no cumple la citada caracter stica. Siempre se cumplirque podamos definir tantas variables ficticias como niveles o categor que as tenga la variable cualitativa. Siempre se cumplirque la suma de las variables binarias de una variable cualitativa es igual a 1. Si el modelo tiene t rmino constante ( ), tendremos que eliminar una variable binaria por cada variable cualitativa, porque de lo contrario aparecer un problema de multicolinealidad perfecta, a y el modelo no podr estimarse. a Si el modelo no tiene t rmino constante, podemos introducir todas las variables binarias. El objetivo de las variables binarias es comparar regresiones de distintos colectivos y para ello, se pueden introduir las variables binarias de dos formas: 1. En forma aditiva: Cuando queramos analizar las posibles diferencias en los t rminos constantes de las regresiones de los distintos colectivos. 2. En forma de interacci Cuando queramos analizar posibles diferencias en las n: pendientes de las regresiones de los distintos colectivos. Modelos B sicos que utilizan Variables Binarias Para explicar la variable dependiente Y (Salario), utilizamos nicamente la variable cualitativa (Sexo) con variables binarias nicamente en forma aditiva. En primer lugar, tendremos que definir las variables binarias correspondientes a las 2 categor as del sexo:

Introducci n

Concepto

M todo de Introducci n de las Variables Binarias en el Modelo

Modelo 1

A continuaci podremos plantear dos modelos alternativas: n 1. Modelo con T rmino Constante: En este caso, deber amos eliminar una variable binaria para evitar la multicolinealidad, por ejemplo, : En estos modelos, es especialmente importante la interpretaci de coeficientes, as n como los contrastes de discriminaci que sirven para verificar si existen diferencias entre los n,

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


distintos colectivos. Tomando las esperanzas condicionadas de la ecuaci anterior, vamos a obtener las n ecuaciones salariables de mujeres y hombres: Salario Medio de Mujer: Salario Medio de Hombre: Restando las esperanzas condicionadas, obtenemos: Interpretaci de Coeficientes: n : Salario Medio de los Hombres. : La diferencia salarial media entre mujeres y hombres. Contraste: Para contrastar si existe discriminaci salarial entre mujeres y hombres: n

2. Modelo sin T rmino Constante: Al no incluir el t rmino constante, podremos introducir las dos variables binarias, y la educaci del modelo ser n a: Tomando esperanzas condicionadas en la ecuaci anterior, obtenemos: n Salario Medio Mujer: Salario Medio Hombre: Interpretaci de los Coeficientes: n y ser respectivamente los salarios medios de mujeres y hombres. an Contraste: Para contrastar si existen diferencias salariales entre mujeres y hombres, habr que a plantear:

Modelo 2

Conclusi n: 1. Comparando el modelo con t rmino constante y el modelo sin t rmino constante, deducimos que en los modelos con t rmino constante, el coeficiente de la variable binaria mide los EFECTOS DIFERENCIALES, mientras que en los modelos sin t rmino constante, los coeficientes de las variables binarias miden EFECTOS ABSOLUTOS. Para explicar la variable dependiente Y (Salario), utilizamos la variable cuantitativa a de os estudio ( ) y la variable cualitativa sexo, con variables binarias nicamente en forma aditiva. En primer lugar, definimos las dos variables binarias correspondientes al sexo:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Vamos a centrarnos en el modelo con t rmino constante y para plantearlo, eliminamos una de las variables binarias, por ejemplo, . La ecuaci del modelo ser la siguiente: n a

Tomando esperanzas condicionadas en la ecuaci anterior, obtenemos las ecuaciones salariales n de mujeres y hombres: 1. Salario Medio de Mujeres:

2. Salario Medio de Hombres: 3. Restando las esperanzas condicionadas: Interpretaci de los Coeficientes: n 1. : Salario medio de los hombres sin estudios ( ). 2. : Pendiente de los dos colectivos, y decimos que a un incremento de un a en los o estudios, le corresponde, en promedio, una variaci de n unidades monetarias en los salarios de mujeres y hombres. 3. : Diferencia salarial media entre mujeres y hombres a igualdad de a de estudios, o os manteniendo en ceteris paribus. Contraste: Para verificar si existen diferencias salariales entre mujeres y hombres:

Modelo 3

Para explicar la variable dependiente Y (Salario), utilizamos la variable cuantitativa a de os estudio ( ) y la variable cualitativa sexo, con variables binarias nicamente en forma aditiva. En primer lugar, definimos las dos variables binarias correspondientes al sexo:

Vamos a centrarnos en el modelo con t rmino constante y para plantearlo, eliminamos una de las variables binarias, por ejemplo, . La ecuaci del modelo ser la siguiente: n a Al incluir la variable binaria en forma aditiva y de interacci con n , este modelo permite analizar diferencias en el t rmino constante y la pendiente de las regresiones de mujeres y hombres. Tomando esperanzas condicionadas en la ecuaci anterior, obtenemos las ecuaciones salariales n de mujeres y hombres. 1. Salario Medio de Mujeres:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


2. Salario Medio de Hombres:

3. Restando las esperanzas condicionadas: Interpretaci de los Coeficientes: n 1. : Salario medio de los hombres sin estudios ( ). 2. : A un incremento de un a en los estudios, le corresponde, en promedio, una o variaci de n unidades monetarias en el salario de los hombres. 3. : La diferencia salarial media entre mujeres y hombres a igualdad de a de estudio. os 4. : La diferencia salarial media entre mujeres y hombres cuando ambos incrementan un a en sus estudios. o Adem en los modelos con t s, rminos de interacci que incluyen variables binarias, pueden n pedir el EFECTO PARCIAL de la variable explicativa que acompa a la variable binaria. Por a ejemplo, para hallar el efecto parcial del rendimiento de la educaci ( ): n

L gicamente, este efecto no es constante. Podr amos contrastar si el efecto parcial de la educaci depende del sexo, planteando lo n siguiente:

Tambi se puede plantear otros contrastes como los siguientes: n 1. Para contrastar si existen diferencias en el t rmino constante de las regresiones de mujeres y hombres, planteamos:

2. Para contrastar si existen diferencias en la pendiente de las regresiones de mujeres y hombres:

3. Para contrastar si existen diferencias salariales entre mujeres y hombres:

Observaciones

Adem de estos 3 modelos b s sicos, se pueden plantear modelos m complejos que incluyan 2 o s m variables cualitativas e incluso podr aparecer t s n rminos de interacci entre 2 variables n binarias. En cualquier caso, siempre tendremos en cuenta que si el modelo tiene t rmino constante, tendremos que eliminar una variable binaria por cada variable cualitativa para evitar la multicolinealidad. Una vez planteado el modelo, calcularemos las diferencias entre colectivos tomando esperanzas condicionadas en el modelo poblacional.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Modelo de Diferencias en Diferencias Hasta ahora, todos los modelos planteados se estimaban apartir de datos de secci cruzada, que n eran conjuntos de observaciones de una o m variables medidas en distintas unidades s econ micas en un instante de tiempo. Por ejemplo, la renta de un conjunto de individuos en 2009. Se denominan datos de secci cruzada fusionadas o datos de panel, a conjuntos de n observaciones de una o m variables medidas en distintas unidades econ s micas en dos per odos distintos de tiempo entre los que ha habido alg cambio estructural pol econ n tico, mico o social. Por ejemplo, el precio de un conjunto de viviendas en 2005 y en 2010 entre los que ha habido un cambio estructural, una crisis econ mica. Para analizar los efectos de este cambio estructural, se plantea el modelo de diferencias en diferencias. Nuestro objetivo es evaluar la repercusi de una elevaci del tope m n n ximo en el subsidio de desempleo sobre la duraci n. Definici de las Variables: n : Duraci del desempleo en semanas (medida en logaritmos). n

Modelo de Diferencias en Diferencias

Aplicaci n

Escribimos el modelo en t rminos poblacionales: La ecuaci anterior es un modelo de diferencias en diferencias, y tiene como objetivo, analizar n c y a qui afectarel cambio de pol econ mo n ticia mica, que en este caso, es la elevaci del n tope m ximo del subsidio por baja laboral. A priori, esta medida s deber afectar a los lo a individuos de rentas altas, que perciben el mayor subsidio y no deber afectar a los de rentas a bajas. Comenzamos interpretando los coeficientes de la ecuaci anterior: n 1. : La duraci de la baja laboral en logatirmos para los individuos de renta no alta antes n del cambio. 2. : La diferencia en la duraci de la baja entre antes y despu del cambio para los n s individuos de rentas no altas. 3. : La diferencia en la duraci de la baja laboral entre los individuos de renta alta y no n alta antes del cambio. 4. : Mide el efecto causal del cambio de pol es decir, la diferencia en la duraci de tica, n la baja laboral de los individuos de rentas altas despu del cambio. s

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Tema 5

Errores de Especificaci n
Omisi de Variables Relevantes (Subespecificaci del Modelo) n n Consisite en eliminar del modelo alguna variable explicativa significativa. La exclusi de una variable relevante o de subespecificaci del modelo. n n Consideremos el siguiente modelo correctamente especificado, que cumple todos los supuestos: Sin embargo, por falta de informaci decidimos omitir la variable n, , que es relevante (significativa) porque . Por eso, planteamos el siguiente modelo mal especificado: Vamos a demostrar que la omisi de la variable relevante n . Teniendo en cuenta que el error: Tomando esperanzas condicionadas: El incumplimiento del supuesto provoca que los estimadores de MCO del modelo segundo sean SESGADOS e INCONSISTENTES. Para obtener el sesgo, necesitamos una expresi que relacione los par n metros de los dos modelos anteriores. Para ello, partimos de la expresi de n y en ella, sustituimos la variable Y por el verdadero modelo: hace que en el modelo segundo la

Concepto Omisi de n Variables Relevantes

Sesgo por Omisi de n Variable

por regla general: es un estimador sesgado de . tiene una interpretaci simple: Es simplemente el coeficiente de n la pendiente de la regresi de n sobre .

no es igual a

Por lo tanto, podemos expresar de la siguiente manera: El sesgo en es omisi de variable. n Resumen del sesgo en . Esto es lo que normalmente se denomina sesgo por cuando se omite : Sesgo Negativo

Sesgo Positivo

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


(Sobreestimaci n) Sesgo Negativo (Infraestimaci n) (Infraestimaci n) Sesgo Positivo (Sobreestimaci n) tiene un

Si , decimos que tiene un sesgo al alza. Si , decimos que sesgo a la baja. De forma general, se puede calcular el sesgo mediante la siguiente f mula:

Conclusi n

Concepto Inclusi de n Variables Irrelevantes

La omisi de una variable relevante provoca SESGO e INCONSISTENCIA en el estimador de n MCO excepto en el caso de incorrelaci entre las variables omitidas y las variables incluidas. n V( ) siempre es m peque que V( ). s a Inclusi de Variables Irrelevantes (Sobreespecificaci del Modelo) n n Significa que una o m de las variables independientes que se han incluido en el modelo no tiene s ning efecto parcial sobre Y en la poblaci es decir, que su coeficiente poblacional es nulo. n n, Supongamos que establecemos un modelo del tipo: Sin embargo, no tiene ning efecto sobre Y cuando n y han sido tenidos en cuenta, lo que significa que . En t rminos de Esperanzas Condicionadas, . En cuanto a la insesgadez de y , no tiene ning efecto. n El a adir una variable irrelevante a una ecuaci normalmente produce un aumento de las n varianzas del resto de los estimadores MCO debido a la multicolinealidad. El incluir una o m variables irrelevantes en un modelo de regresi m s n ltiple, o el sobreespecificar el modelo, no afecta a la insesgadez de los estimadores MCO. Al producir un incremento en las varianzas de dichos estimadores, lo que se conoce como P rdida de Eficiencia, como consecuencia de ello, la inferencia seguirsiendo v lida, pero escasamente fiable. Pese a ello, la inclusi de variables irrelevantes tiene efectos menos graves que la omisi de n n variables relevantes. Errores de Medida en las Variables Cuando planteemos un modelo, puede ocurrir que la variable dependiente o alguna variable independiente est medidas con error. n Especialmente grave es el error de medida en las variables explicativas, ya que provoca el SESGO y la INCONSISTENCIA de los estimadores de MCO. Supongamos el siguiente modelo: Este modelo no puede estimar, porque la variable dependiente observamos la variable Y, que cumple la siguiente ecuaci n: no es observable, y en su lugar,

Efectos

Conclusi n

Concepto

Error de Medida en la Variable Dependiente

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Nuestro objetivo es poder estimar el modelo, y para ello, despejamos y lo sustituimos en la ecuaci primera: n

en la ecuaci anterior n

Llamamos a

, luego:

A continuaci vamos a comprobar los efectos del error de medici en Y y para ello, realizamos n, n dos supuestos adicionales: 1. 2. Supuesto cl sico del Error de Medida en la Variable Dependiente: Suponemos que las variables explicativas y est incorrelacionadas con el error de medida v. Es n decir: y . Efectos de Error de Medida en la Variable Dependiente: 1. Se puede demostrar que si estimamos por MCO, obtendremos estimadores INSESGADOS y CONSISTENTES. 2. Aparentemente, el error de medida en la variable dependiente no tendr consecuencias a graves, pero no es asporque el error del modelo ha aumentado, ha pasado de a . , Adem la varianza de dicho error ha aumentado: s, Este incremento en la varianza del error provoca un incremento en las varianzas de los estimadores, lo que supone una P rdida de Eficiencia, y como consecuencia, la inferencia sigue siendo v pero poco fiable. lida 3. Estos efectos son id nticos a los de la inclusi de variables irrelevantes. n Caso especial en el error de medida en la variable dependiente: 1. Supongamos que , entonces se incumple el supuesto cl sico de error de medida en la variable dependiente. 2. L gicamente, v va a formar parte de u, por lo que . 3. Por lo tanto, la consecuencia serque Supongamos en el siguiente modelo: Como no es observable, el modelo no se puede estimar, y en su lugar, observamos X que cumple la siguiente ecuaci n: Adem antes de analizar los efectos de este error de medida, efectuamos los siguientes s, supuestos: 1. 2. Supuesto Cl sico del error de medida en la variable independiente: Suponemos que la variable medida con error estincorrelacionada con el error de medida v:

Error de Medida en la Variable Independiente

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Para poder estimar la ecuaci en primer lugar despejamos n, sustituimos en la ecuaci primera: n en la ecuaci segunda, y lo n

Llamamos a

, luego el modelo con todas las variables observables ser a:

Si estimamor la ecuaci anterior por MCO, se produce un incremento en la varianza del error n que provoca que aumenten tambi las varianzas de los estimadores. n Sin embargo, el efecto realmente importante, es el SESGO e INCONSISTENCIA de los estimadores de MCO. Para demostrar este sesgo, partimos de la expresi de : n

A continuaci vamos a demostrar que el error de medida en X provoca que n, estimador inconsistente de , es decir, .

sea un

Sesgo Asint o Sesgo de Inconsistencia: tico

Conclusiones sobre el sesgo: 1. A la vista de la expresi obtenida, deducimos que si n es positivo, el sesgo ser negativo. 2. La magnitud del sesgo depende directamente de la varianza del error de medida, ,e inversamente de la varianza de la variable medida con errores . 3. Existen dos casos especiales en los que el sesgo es nulo y es consistente: a) Si tiene un error de medida nulo ( ), entonces y el sesgo ser a 0. b) Supongamos que todas las observaciones de estuviesen medidas con el

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


mismo error, es decir tambi ser nulo. n a , en ese caso, , y el sesgo

Conclusi n: 1. El error de medida en las variables explicativas provoca sesgo e inconsistencia en todos los estimadores de MCO, excepto en los casos especiales. 2. La causa del sesgo es que la variable medida con error estcorrelacionada con el error del modelo inicial ( ), es decir, C( , . 3. En t rminos precisos, se dice que es una variable end gena. 4. El sesgo y la inconsistencia de los estimadores de MCO hace que la inferencia est invalidada.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Tema 6

Modelos con Variables Explicativas End genas


Estimaci de Variables Instrumentales n Antes de plantear este m todo de estimaci debemos definir una variable instrumental e n instrumento Z, que es una variable que cumple las dos siguientes condiciones: 1. La variable instrumental Z debe estar incorrelada con el t rmino de error del modelo , es decir, . Esta condici no puede contrastarse, y s puede razonarse de n lo manera ter rica. 2. La variable instrumental Z debe estar correlacionada con la variable end gena X. Es decir, . Esta segunda condici de instrumento puede comprobarse n planteando una regresi de la variable end n gena X frente a la variable instrumental Z. Planteamos el contraste de identificaci n:

Estimaci de n Variables Instrumentales

Si , por lo que X y Z estar correlacionadas y se cumplirla segnda condici n n de instrumento. Una vez comprobadas las dos condiciones de instrumento, si se cumplen, entonces ser un a instrumento v o adecuado. lido Para ello, introducimos en la C(Z,Y) el valor de la variable Y de la ecuaci n:

Aplicando el principio de analog obtenemos la expresi del estimador de variables a, n instrumentales:

Se puede demostrar que Insesgadez: Consistencia:

es un estimador INSESGADO y CONSISTENTE de

Sin embargo, a pesar de ser un estimador insesgado y consistente, ocurre que:

Donde es el coeficiente de determinaci de la regresi de X sobre Z. n n Conclusi n: 1. El estimador de MCO es siempre m eficiente (tiene menor varianza) que el estimador s de variable instrumental. 2. Cuanto mayor sea la relaci entre X y Z, menor varianza tendrel estimador de n

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


variables instrumentales. 3. Bajo endogeneidad, utilizaremos el estimador de variables instrumentales. Estimaci por M n nimos Cuadrados Biet picos o en dos etapas (MC2E) Hasta ahora, hemos analizado el problema de la endogeneidad nicamente en el Modelo de Regresi Simple. La soluci de la estimaci de Variables Instrumentales, que produc n n n a estimadores de Variables Instrumentales, que produc estimadores insesgados y consistentes. a Sin embargo, el m todo de Variables Instrumentales, es complejo de aplicar en el modelo de regresi m n ltiple, y en su lugar utilizamos la estimaci de m n nimos cuadrados biet picos. Supongamos el siguiente modelo: es una variable end gena, es decir, es una variable ex gena, es decir, Si estimamos esta ecuaci por MCO, obtendr n amos estimadores sesgados e inconsistentes, debido a la endogeneidad de . Para obtener estimadores insesgados y consistentes de , y , utilizamos la estimaci de M n nimos cuadrados biet picos o en dos etapas. Disponemos de una sola variable end gena externa . Buscamos el mejor instrumento posible para la variable end gena , y dicho instrumento es una combinaci lineal de todas las variables ex n genas internas y externas al modelo. 1 Etapa: Estimamos por MCO la ecuaci n: El objetivo de esta etapa es determinar si existe relaci o no entre la variale end n gena externa o posible instrumento. Entonces planteamos el contraste de identificaci n: Donde

Estimaci por n M nimos Cuadrados Biet picos o en dos etapas

Caso 1

En este contraste, debemos rechazar identificaci ( n ). Entonces 2 Etapa: En la ecuaci n valores ajustados .

y decimos que se cumplirla condici de n serun instrumento v lido. , sustituimos la variable end gena , por los

Si estimamos la ecuaci anterior por MCO, obtenemos los estimadores de m n nimos cuadrados biet picos, .

Se trata de estimadores consistentes y asint ticamente normales, es decir, en muestras asint ticas, tienen distribuci normal. n Sin embargo, al igual que ocurr en Variables Instrumentales, los estimadores de M a nimos cuadrados biet picos, son menos eficientes (tienen mayor varianza que los de M nimos Cuadrados Ordinarios).

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Caso 2 Disponemos de m de 1 instrumento, es decir, de m de 1 variable ex s s gena externa. Suponemos que ten 2 variables ex a genas externas: y . Buscamos el mejor instrumento posible para que es una combinaci lineal de todas las n variables ex genas internas ( ) y externas ( y ). 1 Etapa: Estimamos por MCO la ecuaci n: A continuaci planteamos el contraste de identificaci que sirve para determinar si los n n instrumentos y est o no correlacionados con la variable end n gena .

Si , se cumplirla condici de identificaci y los instrumentos n n, y est correlacionados con . Por lo tanto, son instrumentos v n lidos. 2 Etapa: En En la ecuaci n , sustituimos la variable end gena , por los valores ajustados . Si estimamos la ecuaci anterior por MCO, obtenemos los estimadores de M n nimos Cuadrados Biet picos o en 2 etapas, que ser consistentes y asint n ticamente normales, siempre que los instrumentos y sean v lidos. En general, si los instrumentos no son v lidos por incumplir alguna de las condiciones de instrumento, los estimadores de M nimos Cuadrados Biet picos o en 2 etapas ser n INCONSISTENTES y peores que los de MCO, puesto que los estimadores de MCO tambi n son inconsistentes, sin embargo, tienen m nima varianza. Contraste de Sobreidentificaci de SARGAN n Planteamos una regresi de los residuos de M n nimos Cuadrados Biet picos o en 2 etapas, llamados frente a todas las variables ex genas internas y externas. Las hip tesis del contraste de Sargan son:

Conclusi n

Contraste de Sobreidentifica ci de n SARGAN

El estad stico de Contraste es: Si todos los instrumentos est incorrelacionados con el error, entonces ser instrumentos n an v lidos. Si alg instrumento estcorrelacionado con el error, entonces no ser v n a lido. Sin embargo, el contraste de Sargan no dice quinstrumento es no v lido.

Apuntes Realizados y Distribuidos por ZHOUJIE MA