Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Teoría Económica
Estimación
NO SI
• Pese a que EViews fue desarrollado por economistas, y sus usos más importantes son para áreas
relacionadas con la economía, EViews no se limita tan solo al análisis de series económicas ya que es
posible su aplicación en diferentes áreas como las ciencias sociales, ciencias políticas, biología y
ciencias puras.
EViews
¿Qué podemos encontrar?
• INTERFAZ
• TABLAS Y GRAFICOS
–Nuevos tipos de gráficos mixtos
–Panorámica y aumento (Zoom) de gráficos
–Visualización en slides de gráficos múltiples
–Dibujo de rectángulos y elipses
–Tablas y gráficos pueden ser salvados en formato LaTeX
Novedades en EViews 10
• ECONOMETRIA Y ESTADSITICA
–Pronóstico
•ARIMA Automático
•Evaluación de Pronósticos y pruebas de combinación
•Promedio de Pronósticos
•Pronóstico VAR
• ESTIMACIÓN
–Modelos Autorregresivos con Rezados Distribuidos (ARDL) con selección automática de rezagos
–Máxima Verosimilitud y Mínimos Cuadrados Generalizados para estimaciones ARMA
–Estimación de medias grupadas para estimación de modelos de datos panel ARDL
–Regresión por Umbrales
–Nuevo motor de Optimización
Novedades en EViews 10
• PRUEBA Y DIAGNOSTICOS
• Historial de archivos de trabajo automático y controlado por el usuario y copia de seguridad (“Workfile
Backup Snapshots").
• Visualización de estadísticas en vivo para los datos en la vista de hoja de cálculo ("Live Statistics Display").
http://ec.europa.eu/eurostat/data/database
https://ec.sdw-wsrest.ecb.europa.eu
http://data.un.org/WS/
World Bank Data
EViews 10 ofrece una interfaz personalizada a los datos del
Banco Mundial. World Bank Open Data proporciona acceso a
una lista de conjuntos de datos que ofrecen acceso a datos de
desarrollo global. Estas bases de datos ofrecen una amplia
variedad de indicadores disponibles libremente sobre el
desarrollo en países de todo el mundo.
Para más información sobre los conjuntos de datos del Banco
Mundial,
http://data.worldbank.org.
Tanto las versiones Standard como Enterprise de EViews
ofrecen acceso al Banco Mundial. Tenga en cuenta que se
requiere una conexión a Internet para obtener los datos del
Banco Mundial.
EViews ofrece una interfaz personalizada para el Banco Mundial.
La interfaz incluye un navegador personalizado para navegar y
recuperar datos del Banco Mundial.
Gráficos y Tablas
1. Bubble Plots
El gráfico de burbujas requiere un mínimo de
tres series (un triplete en serie). Al crear un
diagrama de burbujas de un objeto de grupo,
tiene dos formas de definir el triple: First vs All o
XYZ triplets.
1. Updating Series in Graph Objects
2. Graph View Text Annotation
3. Interactive Observation Annotation
4. New Templates
5. Element Colors
6. Table Row Sorting
Econometría y Estadística
EViews 10 ofrece soporte para varias covariancias de
coeficientes robustos de heteroscedasticidad nuevas en la
regresión de mínimos cuadrados. Estas alternativas
proporcionan diferentes enfoques para explicar el sesgo en
muestras finitas, ajustando los pesos dados a los residuos
sobre la base del apalancamiento (Long y Ervin, 2000;
Cribari-Neto y da Silva, 2011).
Esta clase general de heteroscedasticidad coherente
covarianza sándwich estimadores se puede escribir como:
Observaciones máximas por serie: (Versión de 4 millones (por defecto). Puede incrementarse
32 bits) hasta 15 millones si se desea, sujeto a
restricciones de memoria.
Observaciones máximas por serie: (Versión de 120 millones.
64 bits)
Observaciones totales (series Limitado únicamente por la RAM disponible.
Máximo número de objetos por archivos de Limitado únicamente por la RAM disponible.
trabajo:
Máximo número de objetos por base de datos: Limitado a 10 millones de objetos, 64 Gb o
espacio disponible en el disco.
MANEJO DE LA INTERFAZ
Ventana
Menú Principal
Ventana de Comandos
Captura de Comandos
Ventana de Dialogo
Área de Trabajo
Línea de Estado
Tipos de Objeto
Barra de titulo
Barra de Herramientas
Ventana de trabajo
Workfile:
Contiene al menos una
página de trabajo
Cada página contiene
una lista de objetos
Eviews Workfile
Nombre del Workfile
RESULTS
Estructura del Workfile
Los datos en este ejemplo
son de tipo serie de tiempo,
los cuales tienen como
frecuencia horizontes
trimestrales desde 1980
hasta 2012.
Basta con abrir el archivo en EViews y dejar que la aplicación haga el resto.
(3)
Click en el botón Sample en la barra de herramientas (1).
Doble click sobre Sample en la ventana del Workfile(2).
Seleccionar Proc/Set Sample desde el menú Workfile(3).
Escribir “smpl” en la ventana de comandos(4).
Cambio de Muetra en Series de Tiempo
Al utilizar cualquiera de los métodos anteriores para
Change/ Set la muestra, EViews abre el cuadro de diálogo
Se debe especificar la muestra en parejas (es decir, como
la fecha u observación en pares).
Cambiar la muestra de enero 1990 a diciembre 2011:
Función Descripción
@all Se refiere al rango del Workfile (incluye todas las observaciones)
@first @last También se refiere al rango del Workfile (todas las observaciones)
Función Descripción
@first+12 @last Excluye las primeras 12 observaciones.
smpl @all
Objeto: Muestra
Series y Grupos
Las Series y los Grupos son los objetos más importantes en EViews.
Operador Descripción
_ Repite el anterior valor no perdido
^ Interpolación lineal.
Función/Comando Descripción
series y=nrnd o (y=@rnorm) Distribución Normal(media 0, st. dev. 1)
series y=rndint(0,100) Crea una serie y con valores enteros aleatorios desde 0
hasta 100.
Funciones: Números Aleatorios PDF y CDF
Generar una serie aleatoria junto con su función de densidad
y la función de distribución acumulada:
1. Escriba en la ventana de comandos:
smpl @all
series d1=@runif(0,2)
show d1 @dunif(d1,0,2) @cunif(d1,0,2)
series y=@mean(x) Crea una serie donde cada observación es igual a la media de
X.
series y=@mean(x,“1980m01 Crea una serie donde cada observación es igual a la media de
1990m12”) X para la muestra (1980m01 to 1990m12)
series y=@median(x) Crea una serie donde cada observación es igual a la mediana
de X.
series y=@vars(x) Calcula la varianza muestral de X (adj. por n-1)
Esto crea un nuevo grupo (llamada “grupo”) que contienen tres series.
2b. Ahora escriba el siguiente comando:
series new=@rmean(grupo)
Esto crea una serie la cual calcula la media de las tres series por cada fila
3. Presionar Enter después de cada línea de comando.
Funciones: Estadística Descriptiva
Si se quiere juntar en un vector (o matriz) estadísticas
descriptivas.
Función Descripción
gdp(-4) Indica el 4° rezago de la serie
gdp(2) Indica el 2° adelanto de la serie
gdp (-1 to -4) Especifica desde el rezago 1 hasta el 4
gdp(to -5) o gdp (0 to -5) Especifica desde el rezago 0 hasta el 5
series y = @lag(gdp,3) Genera una serie y, como el 3 rezago de la serie
series y =@lag((gdp-inv)/gdp,4) Genera una serie y, como el 4 rezago de la transformación
(gdp-inv)/gdp
Funciones: Series de Tiempo
Función Descripción
d(gdp) = gdp - gdp(-1) Toma la primera diferencia de la
serie
dlog(gdp) = log(gdp) – log(gdp(-1)) Toma la primera diferencia
logarítmica se la serie
Funciones: Series de Tiempo
Función Descripción
d(gdp,3) Se diferencia tres veces la serie ((1-L)3X) (Nota: Esto NO
es lo mismo que X-X(-3); esto es X-3X(-1)+3X(-2)-X(-3))
dlog(gdp,4) Se diferencia cuatro veces la serie log(GDP) (1-L)4log(X).
Funciones: Series de Tiempo
Diferencias Estacionales Función Descripción
d(gdp,1,4) Diferencia en la parte regular con una
diferencia estacional de orden 4.
d(gdp,0,4) o gdp-gdp(-4) Calcula solo la diferencia estacional de
orden 4.
(1)5782.4-5903.4=-121
5771.7-5782.4=-10.7
5878.4-5771.7=106.7
6000.6-5878.4=122.2
5952.7-6000.6=-47.9
(2)-47.9 –(-121)=73.1
Diferencia Estacional
(1)6000.6-5903.4=97.2
Funciones: Series de Tiempo
Cambios Porcentuales
Función Descripción
@pc(gdp) Calcula el cambio porcentual de un periodo (en
porcentaje)
@pch(gdp) Calcula el cambio porcentual de un periodo (en
decimales)
@pca(gdp) Calcula el cambio porcentual de un periodo
anualizado (en porcentaje) (1+@pch(x))n-1 (donde
n=4 para datos trimestrales, n=12 para datos
mensuales, etc)
@pcha(gdp) Calcula el cambio porcentual de un periodo
anualizado (en decimales)
@pcy(gdp) Calcula el cambio porcentual anual (en porcentajes)
Función Descripción
@cumsum(x,s) Suma Acumulativa de los valores de X para la muestra s
@cumprod(x,s) Multiplicación Acumulada de los valores de X para la muestra s
Función Descripción
@trend Genera una serie de tendencia que se incrementa con cada observación.
@trend^2 Genera una serie de tendencia cuadrática que se incrementa con cada observación.
Funciones Fecha
Función Descripción
@year Devuelve el año en el cual cada observación comienza.
Función Descripción
@daycount Devuelve el número de días entre cada observación.
@before(“date”) Devuelve una variable dummy con el valor igual a 1 antes de la fecha
especificada.
@after(“date”) Devuelve una variable dummy con el valor igual a 1 con y después de
la fecha especificada.
@during(“date1 Devuelve una variable dummy con el valor igual a 1 para cada
date2”) observación entre date1 y date2.
@holiday Devuelve la proporción de un evento anual (ejemplo, festivos) que se
encuentra en cada observación.
Funciones Fecha
La funciones de fecha son muy útiles para
relacionar variables dummy.
Supongamos que queremos crear una variable
dummy que toma el valor de uno después de
1980 y cero en caso contrario.
Función Descripción
@date Devuelve el ‘Número días’ para el comienzo de estas observaciones.
@dateadd Desplaza una fecha adelante o hacia atrás por una unidad de tiempo
@datefloor Redondea hacia abajo una fecha para el comienzo de una unidad de tiempo
“d” días
“b” días laborables
“a” o “y” anual
“q” trimestres
Funciones Fecha: Avanzadas
En un Workfile mensual, se puede encontrar el
número de días por mes.
smpl if return>0.2
series dummy1=1
smpl if return<=0.2
series dummy1=0
3. Presionar Enter
Variable Dummy: Creación de Dummies
Cuando el tipo de información no tiene ningún tipo de
estructura, es decir, corte transversal, se puede seguir la
misma metodología cuando es una serie de tiempo. Sin
embargo, se debe reemplazar @date por @obsnum.
2. Presionar Enter.
2. Presione Enter.
2. Presione Enter.
Variable Dummy: Creación de Dummies
Categóricas en Regresión
Una de las características convenientes de EViews
es que se puede utilizar expresiones ficticias en
regresiones sin tener que crear primero y guardar la
variable dummy.
Suponga que desea estimar una regresión de return
sobre el volume1 y una variable ficticia igual a 1 para
todas las fechas después de 02/12/1994.
1. Puede escribir el siguiente comando o generar
una ecuación a partir de Quick →Estimate
Equation:
equation eq1.ls return c volume1
@date>@dateval("1994/12/2")
2. Como se puede ver, EViews estima el
coeficiente de la variable ficticia directamente sin
tener que crear y guardar la fecha ficticia
primero.
Variable Dummy: Creación de Dummies
Categóricas en Regresión
Suponga que se quiere realizar una regresión de wage en
función de exper y educ, además incluir cuatro variables
dummy creadas a partir de @expand(female,married).
La conversión de frecuencia permite convertir una serie de datos desde una frecuencia de Workfile a
otra.
La forma más fácil de EViews para llevar a cabo la conversión de frecuencia, es copiar una serie de una
página de Workfile a otra página con una frecuencia diferente. *
* A pesar de que EViews también permite copiar de un Workfile a otro Workfile, a menudo tiene sentido realizar la copia entre las
páginas de un mismo Workfile.
Conversión de Frecuencias: De Frecuencia Baja hacia Alta
Es realmente fácil en EViews convertir los datos de menor
frecuencia (por ejemplo, de frecuencia trimestral) en datos
de frecuencia más alta (por ejemplo, frecuencia mensual).
Suponga que tiene datos trimestrales del PIB y desea
convertir estos a datos mensuales.
1. Clic sobre la página Annual_Panel. Clic derecho sobre la serie pop y seleccionar
Copy.
La suma de GDP sobre los cuatro trimestres por cada país (contracción por
fecha)
La suma de GDP para cualquier año sobre todo el corte de paises
(contracción por país)
6. Clic OK.
Datos de Panel a Datos de Panel: Alta a Baja Frecuencia
• Hay un problema en el anterior ejemplo. La página Annual_Panel (página destino) tiene 6 países (excluye US),
mientras que la página Quarterly_Panel (página origen) tiene siete países (incluyendo US).
• La contracción (suma) se llevó a cabo en base a la muestra de la página de origen (los 7 países). No hay ninguna
razón para sumar más de los 7 países, si la página de destino (Annual_Panel) tiene sólo 6
• Para solucionar este problema, tenemos que excluir “US" de la muestra. Podemos hacerlo cambiando Source
Sample en el cuadro de diálogo de la siguiente manera:
Datos de Panel a No Panel
Aquí hay una lista (exhaustiva) de tipo de conversión desde Datos de Panel o No Panel:
Datos panel a Series de Tiempo: Misma Frecuencia
Datos Panel a Series de Tiempo: Frecuencia baja de Datos Panel a Frecuencias Altas de
Series de Tiempo.
Datos Panel a Series de Tiempo: Frecuencia alta de Datos Panel a Frecuencias bajas de
Series de Tiempo.
Datos Panel a Corte Transversal
Datos de Panel a No Panel: Misma Frecuencia
Suponga que se quiere copiar la información GDP desde la
página Quarterly_Panel hacia la página TimeSeries_Quarterly).
1. Clic sobre la página Quarterly_Panel, clic derecho sobre la
serie GDP y seleccionar Copy.
2. Clic sobre la página TimeSeries_Quarterly, clic derecho y
seleccionar Paste Special.
3. Como es usual, la ventana de dialogo Paste Special se abrirá.
Seleccionar Series (by value) sobre la sección Paste as. Bajo la
sección Merge by, elegir General match merge criteria .
Bajo Match merge Options, el ID de origen y el de Destino son establecidos
en @date (por defecto). Esto indica a EViews que la conversión se hará por
fecha (es decir, utiliza la estructura de la fecha en la página del panel para
alinear las observaciones con la estructura de la fecha en la página no
Panel). 5. Escoger Mean como contraction method. Esto calcula el
promedio GDP para los siete países en la página
4. Establezca Contraction method. Esto indica a EViews sobre cómo contraer (agregar) Quarterly_Panel y colocar este valor en el correspondiente
los datos de cortes transversales con el fin de calcular una sola serie de tiempo. Hay trimestre en la página TimeSeries_Quarterly.
un menú desplegable de opciones, pero las conversiones más utilizados son : 6. Clic OK.
Sum (suma de los cortes transversales para cada periodo).
Mean (promedio de los cortes transversales para cada periodo)
Datos de Panel a No Panel: Panel Baja
Frecuencia a No Panel Alta Frecuencia
Supongamos que se quiere convertir la información population desde la página Annual_Panel a la página
TimeSeries_Quarterly.
1. Clic sobre la página Annual_Panel , clic derecho sobre la serie pop y seleccionar Copy.
2. Clic sobre la página TimeSeries_Quarterly y seleccionar Paste Special.
3. La ventana de dialogo Paste Special se abrirá. Seleccionar Series (by value) bajo la sección Paste as y
General match merge criteria bajo la sección Merge by.
4. Bajo Match merge Options, establecer Source ID y Destination ID con @date.
5. Recordar que EViews necesita saber:
Como se va agregar la información entre países
Como se va a realizar la conversión de frecuencias bajo-alto.
• Para decirle a Eviews el método de contracción que se utilizara, seleccione una de las opciones en
Contraction method. Escoga Sum.
Esto le dice a EViews que debe sumar la población entre países por cada año(agregación
país/contracción).
La conversión de baja a alta frecuencia se consigue mediante el uso de Constant-match
average (esta es la única opción), lo que significa que el valor se repite para cada período de alta
frecuencia.
• NOTA: Si seleccionamos otro método de conversión (es decir, Mean), los datos se promedian en todos los
países (para calcular una sola serie de tiempo) y luego se repite para cada trimestre correspondiente en el
archivo de alta frecuencia..
6. Clic OK.
Datos de Panel a No Panel: Panel Alta
Frecuencia a No Panel Baja Frecuencia
Suponga que quiere copiar la información GDP desde la página Quarterly_Panel hasta la página
TimeSeries_Annual.
1. Clic sobre la página Quarterly_Panel, clic derecho sobre la serie gdp y seleccionar Copy.
2. Clic sobre la página TimeSeries_Annual, clic derecho y seleccionar Paste Special.
3. La ventana de dialogo Paste Special se abrirá. Seleccionar Series (by value) en la sección Paste
as y General match merge criteria en la sección Merge by.
4. Bajo Match merge Options, establecer Source ID y Destination ID con @date.
5. Recordar que EViews necesita saber :
Como se va agregar la información entre países
Como se va a realizar la conversión de frecuencias alto-bajo.
• Para decirle a Eviews el método de contracción que se utilizara, seleccione una de las opciones en
Contraction method. Escoga Sum.
Esto le dice a EViews que debe sumar el GDP entre países por cada trimestre (agregación
país/contracción).
También EViews suma el GDP de cada trimestre del año (conversión de frecuencia).
• NOTA: El método utilizado para la contracción del corte transversal también se aplicara a la
conversión de frecuencia. Por ejemplo, si usted elige Sum, los datos se resumen con los cuatro
trimestres del año y luego suma todos los países.
• Si seleccionamos otro método de conversión (es decir, Mean), los datos se promedian en todos los
países (para calcular una sola serie de tiempo) y luego promedia en los cuatro trimestres (para
obtener el valor anual).
6. Clic OK.
Datos de Panel a No Panel: Datos Panel a Corte Transversal
Suponga que se quiere copiar los datos trimestrales de GDP
desde la página Quarterly_Panel hacia la página Cross_Section
(la cual tiene los mismos identificadores de corte transversal (o al
menos alguna sobre posición).
1. Clic sobre la página Quarterly_Panel, clic derecho sobre la serie
GDP y seleccionar Copy.
2. Clic sobre la página Cross_Section, clic derecho y seleccionar
Paste Special.
3. La venta de dialogo Paste Special se abrirá. Bajo la sección
Paste as seleccionar Link.
4. Bajo la sección Merge by, selecciones General match merge
criteria.
5. Bajo Match merge Options se puede ver que Source ID y
Destination ID están establecidos en @country. Esto le dice a
EViews que la conversión se realizará por país (es decir, utiliza
la estructura del corte transversal de la página del panel para
alinear las observaciones con la estructura del corte transversal
de la página no Panel).
6. Establezca Contraction method. Esto le dice a EViews como se
va a contraer la información de series de tiempo en una serie de
corte transversal. Hay muchas opciones, pero las más usadas
son Mean y Sum. Seleccionar Mean.
7. Clic OK.
No Panel a Panel
Aquí hay una lista (exhaustiva) de tipo de conversión desde Datos de Panel o No Panel:
Como se observa en el gráfico, la opción Single Graph – First vs. All, traza la primera serie
(en nuestro caso 3m Tbill ) en el eje horizontal contra toda la serie restante que se representa
en el eje vertical.
Es un poco difícil de discernir todas las diferencias, pero es evidente que existe una relación
positiva entre el T Bill 3M y otras tasas de interés
MS Gráficas Simples: Scatter Plot
Multiple Graphs – First vs. All Single Graph– Stacked Single Graph – XY pairs
Observe que este ajuste traza la primera serie (Tbill Observe que la primera serie (tbill3m) se representa •Observe que los diagramas de dispersión se grafican en
3m) en contra de las demás series, pero cada par se frente a la segunda serie (tbill6m), a continuación, en pares: primera serie (tbill3m) se traza en contra de la
representa en gráficos separados. contra de la suma de la segunda y la tercera serie segunda serie (tbill6m), mientras que la tercera serie
Es un poco más fácil ver ahora (como es lógico), (tbill6m y tnote2y) y, finalmente, contra la suma de la (tnote2y) se representa frente al cuarto (tnote10y).
Tbill 3m está más estrechamente relacionado con las segunda, tercera y cuarta serie (tbill6m, tnote2y y •Observe también que la primera serie de cada par se
tasas d6M, en comparación a los otros tipos de tnote10y). encuentra en el eje horizontal, mientras que la segunda
interés serie se representa en el eje vertical.
•Si hay un número impar de serie, se ignora la última
serie
MS Gráficas Simples: Scatter Plot
Multiple Graphs – XY pairs Scatterplot matrix
Observe que la primera serie (tbill3m) se representa frente •Tenga en cuenta que los gráficos de dispersión se crean
a la segunda serie (tbill6m), mientras que la tercera serie para todas las posibles combinaciones de pares de las
(tnote2y) se representa gráficamente en contra de la cuatro series en el grupo.
cuarta (tnote10y). Los dos diagramas de dispersión se •Una última opción (matriz triangular inferior) es similar a
muestran en gráficas separadas. la matriz de dispersión, pero muestra sólo los elementos
triángulo inferior de la gráfica que se muestra aquí.
MS Gráficas Simples: XY Line
• XY line son gráficos muy similares a los de dispersión,
donde los puntos consecutivos se conectan con líneas.
1. Supuesto de linealidad
2. Supuesto del valor esperado del error
3. Supuesto de Homocedasticidad
4. Supuesto de no Autocorrelación
5. Supuesto del comportamiento del error
6. Supuesto de ortogonalidad
7. Otros problemas
1. Multicolinealidad
2. Forma funcional
3. Omisión de variables importantes
4. Variables redundantes
5. Estabilidad de los parámetros
Propiedades de los Coeficientes por M.C.O
Teorema de Gauss Markov:
Lineal: función lineal de una variable aleatoria, como la variable dependiente Y en el modelo de regresión.
Eficiencia: tiene varianza mínima dentro de la clase de todos los estimadores lineales insesgados.
Consistencia: los parámetros estimados por el modelo de M.C.O son consistentes, es decir:
Donde Pr representa la probabilidad y gamma un número pequeño seleccionado arbitrariamente y que presenta la
diferencia (distancia) entre el parámetro y el coeficiente estimado. Conforme el tamaño de muestra aumente y tiene a
infinito, la probabilidad que el estimador de MCO sea diferente del verdadero valor poblacional. Esta propiedad es una
propiedad asintótica de los estimadores del modelo de M.C.O.
Propiedades de los Estimadores MCO
• Lineal->Función Lineal de una variable aleatoria, 𝐵 𝑀𝐶𝑂 = (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌 → 𝑌 = 𝑋𝐵 + 𝑢
𝐸(𝐵 𝑀𝐶𝑂 ) = 𝐸 𝑋 ′ 𝑋 −1
𝑋 ′ 𝑋𝐵 + 𝐸( 𝑋 ′ 𝑋 −1 ′
𝑋 𝑢)) = 𝐵
• Eficiente-> Tiene varianza mínima dentro de la
clase de todos los estimadores lineales insesgados,
𝑉(𝐵 𝑀𝐶𝑂 ) = 𝐸 𝐵 − 𝐵 ∗ 𝐵 − 𝐵 ′
un estimador insesgado con varianza mínima se
conoce como estimador eficiente. 𝑉(𝐵 𝑀𝐶𝑂 ) = 𝐸 (𝐵 + 𝑋 ′ 𝑋 −1
𝑋 ′ 𝑢 −𝐸(𝐵 𝑀𝐶𝑂 ) ∗ (𝐵 + 𝑋 ′ 𝑋 −1
𝑋 ′ 𝑢 −𝐸(𝐵 𝑀𝐶𝑂 ))′
𝑉(𝐵 𝑀𝐶𝑂 ) = 𝐸 (𝑋 ′ 𝑋 −1 ′
𝑋 𝑢𝑢′ 𝑋 𝑋 ′ 𝑋 −1
)
• Consistente->ampliando la muestra, el valor
𝑉(𝐵 𝑀𝐶𝑂 ) = 𝜎 2 𝐼
estimado coincide con el real.
Supuesto 1: el modelo de mínimos cuadrados ordinarios, asume que la relación entre dos o más
variables puede ser adecuadamente modelada a través de una función lineal.
Supuesto 2: el valor esperado de los errores es igual a cero:
𝐸 𝑒 =0
Supuesto 3: la varianza de los errores es constante (Homocedástico) y, la autocorrelación entre
errores no contemporáneos es cero (no autocorrelación).
𝜎 2 𝑝𝑎𝑟𝑎 𝑖 = 𝑗
𝐸 𝑒2 =ቊ
0 𝑝𝑎𝑟𝑎 𝑖 ≠ 𝑗
Violación de los supuestos de regresión
Supuesto 4: la varianza de los errores se distribuye como una normal con
media igual a cero y desviación estándar a 𝜎 ∗ 𝐼𝑛 .
Supuesto 5: la covarianza de los errores con las variables independientes es
cero. Es decir, que los errores y las variables exógenas son ortogonales.
Supuesto 6: el numero de observaciones debe ser mayor que el número de
parámetros a estimar.
Supuesto 7: debe existir variabilidad en los valores de x, variable
independiente. Técnicamente la varianza de x debe ser un numero finito
positivo.
Violación de los supuestos de regresión
Supuesto 8: el modelo de regresión debe ser correctamente especificado,
esto indica que no existe ningún error en el modelo a estimar. La
especificación incorrecta o la omisión de una o más variables importantes,
hará muy cuestionable la validez del modelo.
Supuesto 9: No hay relaciones perfectamente lineales entre las variables. No
existe multicolinealidad perfecta.
Violación de los supuestos de regresión
Supuesto 1: el modelo de MCO asume que la relación entre la variable dependientes y las variables
independientes puede ser adecuadamente descrita por una ecuación lineal.
Se recuerda que se pueden tener relaciones no lineales entre las variables que pueden ser
convertida en ecuaciones lineales.
Para estudiar si los datos se ajustan a un modelo lineal se emplea la prueba de análisis de varianza
que se basa en la prueba F de Fisher. Las hipótesis que se desean probar son las siguientes:
𝐻𝑜 : 𝑁𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑢𝑛𝑎 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑒𝑛𝑡𝑟𝑒 𝑦 𝑦 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠
𝐻1 : 𝐸𝑥𝑖𝑠𝑡𝑒 𝑢𝑛𝑎 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑒𝑛𝑡𝑟𝑒 𝑦 𝑦 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠
𝑅2ൗ
𝑘−1
Recordar que el estadístico de prueba es: 𝐹𝑐 = ൘1−𝑅2ൗ ,y el valor critico
𝑛−𝑘
1. Métodos Informales
a) Naturaleza del Problema
En la información de corte transversal que comprende unidades heterogéneas, la
heteroscedasticidad puede ser la regla y no la excepción. Por ejemplo, establecer relaciones
entre Ventas y Gasto Publicitario, Salarios en función de los años de escolaridad, Consumo e
Ingreso…
a) Método Gráfico
Se utiliza cuando no hay información a priori o empírica sobre la naturaleza de la
heteroscedasticidad. En la práctica se puede llevar a cabo un análisis de regresión y luego hacer
un examen de los residuos elevados al cuadrado, para ver si exhiben un patrón sistemático.
La idea es averiguar si el valor medio estimado de Y esta relacionado sistemáticamente con el
residuos al cuadrado.
Violación de los supuestos de regresión
Supuesto 3: Homocedasticidad. ¿Cómo detectar?
La Homocedasticiad en un modelo univariado, se puede apreciar mediante un
gráfico de dispersión entre la variable exógena (x) y el error estimado.
2. Métodos Formales
a. Prueba de Park
Park formaliza el método gráfico con la sugerencia de que 𝜎𝑖2 es algún tipo de función de la
variables independiente X. La forma funcional es:
𝛽
𝜎𝑖2 = 𝜎 2 𝑋𝑖 𝑒 𝑣𝑖 o Ln 𝜎𝑖2 = 𝐿𝑛 𝜎 2 + 𝛽𝐿𝑛𝑋𝑖 + 𝑣𝑖
Como 𝜎𝑖2 por lo general no se conoce se puede utilizar la siguiente aproximación:
Ln 𝑢ො 𝑖2 = 𝐿𝑛 𝜎 2 + 𝛽𝐿𝑛𝑋𝑖 + 𝑣𝑖
2. Métodos Formales
b. Prueba de Glejser
Similar a la de Park, después de obtener los residuos de la regresión por M.C.O, se
sugiere una regresión auxiliar sobre los valores absolutos de 𝑢ො 𝑖 sobre la variable X que se
cree muy asociada con 𝜎𝑖2 . Estas son las formas funcionales:
𝑢ො 𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑣𝑖
𝑢ො 𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑣𝑖
1
𝑢ො 𝑖 = 𝛽0 + 𝛽1 + 𝑣𝑖
𝑋𝑖
1
𝑢ො 𝑖 = 𝛽0 + 𝛽1 + 𝑣𝑖
𝑋𝑖
Violación de los supuestos de regresión
Supuesto 3: Homocedasticidad. ¿Cómo detectar?
2. Métodos Formales
c. Prueba de Breusch-Pagan-Godfrey
𝑌𝑖 = 𝛽0 + 𝛽2 𝑋2𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝑢𝑖
𝑢ො 𝑖2൘
𝑝𝑖 = Cada residuos elevado al cuadrado divido entre 𝜎 2
𝜎 2
4. Hacer la regresión de los 𝑝𝑖 construidos sobre las Z:
𝑝𝑖 = 𝛼0 + 𝛼1 𝑍1𝑖 + ⋯ + 𝛼𝑚 𝑍𝑚𝑖 + 𝑣𝑖
5. Obtener la suma cuadrada explicada y definir Theta. Si se supone que los errores están
normalmente distribuidos, se demuestra que hay homoscedasticidad.
1 2
𝜃= 𝑆𝐶𝐸 𝜃~𝑥𝑚−1
2
Violación de los supuestos de regresión
Supuesto 3: Homocedasticidad. ¿Cómo detectar?
2. Métodos Formales
d. Prueba general de Heteroscedasticidad de White
Propuesta que no se apoya en el supuesto de normalidad
2
𝑛 ∗ 𝑅2 ~𝑥𝑔𝑙
𝑌𝑖ൗ ∗ 1 ∗ 𝑋1ൗ 𝑢ො 𝑖
𝜎𝑖 = 𝛽0 ൗ𝜎𝑖 + 𝛽1 𝜎𝑖 + ( ൗ𝜎𝑖 )
σ 𝑥𝑖2 𝑢ො 𝑖2
𝑣𝑎𝑟 𝛽መ1 =
(σ 𝑥𝑖2 )2
La varianza de todo coeficiente de regresión parcial, por ejemplo 𝛽መ𝑗 ,se obtiene así:
𝑁
ෝ𝑗𝑖2 𝑢ො 𝑖2
σ𝑤 𝑁
𝑣𝑎𝑟 𝛽መ𝑗 = O MATRICIALMENTE (𝑋 ′ 𝑋)−1 [ 𝑒𝑖𝑋𝑖 ′ (𝑒𝑖𝑋𝑖)](𝑋 ′ 𝑋)−1
ෝ𝑗𝑖2 )2
(σ 𝑤 𝑁−𝑘
𝑖=1
Donde 𝑢ො 𝑖2
son los residuos al cuadrado obtenidos de la regresión, y 𝑤ෝ𝑗𝑖2 son los residuos al cuadrado proporcionados por la
regresión auxiliar de la regresora 𝑋𝑗 sobre las regresoras restantes.
Medidas Correctivas
Los estimadores obtenidos por el ajuste de varianzas y covarianzas de White pueden no ser tan eficientes
como los obtenidos por métodos que transforman la información. El procedimiento eficiente, MCG, pondera
cada residual cuadrado con el inverso de la varianza condicional de los errores dado la variable.
En la mayoría de los casos, la forma exacta de la heterocedasticidad no es obvia. Es decir, es difícil encontrar la función del
comportamiento de la varianza del error. Sin embargo, en muchos casos puede modelarse la función y utilizar los datos para estimar
los parámetros desconocidos del modelo.
𝑉𝑎𝑟 𝑢 𝑥 = 𝜎 2 exp(𝛿0 + 𝛿1 𝑥1 + 𝛿2 𝑥2 + ⋯ + 𝛿𝑘 𝑥𝑘 )
+ 𝛿2 𝑌𝑖
log 𝑢2 = 𝛼0 + 𝛿1 𝑥1 + 𝛿2 𝑥2 + ⋯ + 𝛿𝑘 𝑥𝑘 + 𝑣𝑖 ó log 𝑢2 = 𝛼0 + 𝛿1 𝑌𝑖 2 + 𝑣𝑖
Procedimientos
1. Realizar la regresión por M.C.O. La variable dependiente en función de las independientes y obtener los residuos.
2. Obtener el logaritmo de los residuos al cuadrado.
3. Realizar la regresión del logaritmo natural de los residuos en función de las variables independientes.
4. Sacar el antilogaritmo a los valores ajustados
5. Estimar la ecuación ponderando el residual al cuadrado con 1/ℎ𝑖
Medidas Correctivas
Tener que estimar hi con los mismos datos significa que el estimador de MCGF deja de ser insesgado. Sin
embargo, el estimador de MCGF es consistente y asintóticamente más eficiente que M.C.O, por lo tanto,
tienen estadísticos de prueba con las distribuciones t y F, para muestras grandes. Si se tiene alguna duda
sobre el comportamiento de la varianza especificada en las ecuaciones, puede utilizarse errores estándar
robustos a la heterocedasticidad.
En casos de una fuerte heterocedasticidad, suele ser mejor usar una forma incorrecta de Heterocedasticidad
y emplear MCP que ignorar por completo la heterocedasticidad y usar M.C.O. Según Fox (1997), una
heterocedasticidad fuerte es cuando la varianza del error más grande sea mayor que 10 veces la más
pequeña.
Conclusiones
• La ventaja de MCP consiste en que son mas eficientes que el estimador de M.C.O, al menos
asintóticamente. La desventaja esta en conocer la función de la varianza condicional. Si la forma
funcional es incorrecta, entonces los errores estándar calculados mediante rutinas de regresión MCP no
son validos, incluso para una muestra grande. No obstante, se podría aplicar errores robustos con el
propósito de estimar un modelo donde la función de la varianza este arbitrariamente mal especificada.
• La ventaja de utilizar errores robustos es que dan lugar a inferencias asintóticamente válidas incluso si
no se conoce la forma de la función de la varianza condicional. La desventaja es que el estimador de
MCO tendrá una mayor varianza que el estimador de MCP, al menos asintóticamente.
• Conclusión final: Siempre será buena idea calcular errores estándar y estadísticos de prueba
completamente robustos de la estimación de MCP.
Violación de los supuestos de regresión
Supuesto 4: No autocorrelación. Este supuesto establece que los errores de la regresión no deben
ser serialmente correlacionados, es decir, que los errores en el periodo i, no deben depender de los
errores de cualquier otro periodo j.
Violación de los supuestos de regresión
Supuesto 4: No autocorrelación. ¿Qué causa la autocorrelación de los errores?
La existencia de un patrón estacional.
El uso de una forma funcional incorrecta.
Omisión de variables relevantes.
¿Cómo se detecta?
El test de Durbin Watson permite determinar la presencia de autocorrelacion de primer
orden, es decir:
𝑒𝑖 = 𝑝𝑒𝑖−1 + 𝑣𝑖
La hipótesis son las siguientes:
𝐻0 : 𝑝 = 0 𝑛𝑜 ℎ𝑎𝑦 𝑝𝑟𝑒𝑠𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑝𝑟𝑖𝑚𝑒𝑟 𝑜𝑟𝑑𝑒𝑛
𝐻1 : 𝑝 ≠ 0 ℎ𝑎𝑦 𝑝𝑟𝑒𝑠𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑝𝑟𝑖𝑚𝑒𝑟 𝑜𝑟𝑑𝑒𝑛
Violación de los supuestos de regresión
Durbin Watson
σ𝑡=𝑛 ො 𝑡 − 𝑢ො 𝑡−1 )2
𝑡=2 (𝑢
𝑑=
σ𝑡=𝑛 ො 𝑡2
𝑡=1 𝑢
Violación de los supuestos de regresión
Supuesto 4: No autocorrelación. ¿Cómo se detecta?
El test de Breusch-Godfrey sigue la siguiente forma:
𝑒𝑖 = 𝑝𝑒𝑖−1 + 𝑝𝑒𝑖−2 + ⋯ + 𝑝𝑒𝑖−𝑚 + 𝑣𝑖
La hipótesis son las siguientes:
𝐻0 : 𝑝1 = 0, 𝑝2 = 0, … , 𝑝𝑚 = 0 = 0 𝑛𝑜 ℎ𝑎𝑦 𝑝𝑟𝑒𝑠𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛.
𝐻1 : 𝑝1 ≠ 0, 𝑝2 ≠ 0, … , 𝑝𝑚 ≠ 0 ℎ𝑎𝑦 𝑝𝑟𝑒𝑠𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛
El test se distribuye como una distribución chi-cuadrada con m grados de libertad, m es el
número de rezagos utilizados en la ecuación.
(𝑛 − 𝑚)𝑅 2 ~𝑥 2 (𝑚)
Violación de los supuestos de regresión
Supuesto 4: No autocorrelación ¿Cuáles son las consecuencias?
La presencia de autocorrelación no afecta la propiedad de insesgamiento de los coeficientes. Sin embargo
los parámetros no serán eficientes, esto significa que las inferencias serán incorrectas. En la presencia de
autocorrelación positiva, los errores estándar serán sesgados hacia abajo, lo que significa que los test
estadísticos sean grandes, lo que a su vez incrementará la probabilidad de rechazar la hipótesis nula siendo
verdadera. También, como la varianza de los errores es menor, el 𝑅 2 será mayor.
¿Como se corrige?
1. Primeras diferencias.
2. Método de Newey-West.
3. Método de Cochrane-Orcutt
Violación de los supuestos de regresión
Supuesto 4: No autocorrelación
1. Método de Cochrane-Orcutt
1. Este método se basa en el supuesto que la forma de la autocorrelación es
conocida o que se puede determinar analizando los datos.
2. Procedimiento
1. Estimar el modelo.
2. Determinar la autocorrelación usando un test.
3. Si se presenta autocorrelación se debe evaluar la regresión de los errores en función de
su pasado y obtener el valor de p.
4. Con ese valor p estimar la nueva regresión.
Violación de los supuestos de regresión
Supuesto 5: Normalidad de los errores. ¿Cómo se detecta?
El test de normalidad de Jarque Bera, tiene las siguientes hipótesis:
𝐻𝑜 : 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙
𝐻1 : 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑛𝑜 𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙
El test es dado por:
𝑛 2 1
𝐽𝐵 = 𝑆 + (𝑘 − 3)2 ~𝑥 2 2 ; 𝑠𝑖𝑒𝑛𝑑𝑜 𝑆 𝑒𝑙 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑎𝑠𝑖𝑚𝑒𝑡𝑟í𝑎 𝑦 𝑘, 𝑙𝑎 𝑐𝑢𝑟𝑡𝑜𝑠𝑖𝑠.
6 4
Violación de los supuestos de regresión
Supuesto 5: Normalidad de los errores ¿Cuáles son las causas?
Presencia de estacionalidad en los datos
Presencia de valores extremos
¿Cómo se corrige?
1. Hacer caso omiso si se cuenta con una muestra bastante amplia.
(Teorema del limite central)
2. Incluir variables dicotómicas temporales ó inclusión de valores extremos.
Violación de los supuestos de regresión
Otros problemas del modelo de M.C.O: Multicolinealidad
Se presenta cuando hay una alta correlación entre las variables explicativas
del modelo.
¿Cómo detectar?
1. Se observarán 𝑅2 bastantes altos acompañados de parámetros
estadísticamente no significativos.
2. Evaluar el factor inflador de varianza, a partir de regresiones auxiliares de
la variable independiente en función de las independientes.
1
𝐹𝐼𝑉 = 2 > 10 𝑠𝑒 𝑡𝑖𝑒𝑛𝑒 𝑚𝑢𝑙𝑡𝑖𝑐𝑜𝑙𝑖𝑛𝑒𝑎𝑙𝑖𝑑𝑎𝑑
1 − 𝑅𝐽
Violación de los supuestos de regresión
Otros problemas del modelo de M.C.O: Multicolinealidad ¿Cómo se corrige?
Variables omitidas
Formas funcionales incorrectas
Presencia de correlación entre los errores y las variables independientes.
Violación de los supuestos de regresión
Otros problemas del modelo de M.C.O: Forma funcional ¿Cómo se detecta?
Test de Ramsey:
La hipótesis de este test son:
Modelo Datos
Modelo Teoría
Datos Selectos
Econométrico Econométrica
Basado en Intriligator (1990) Modelos Econométricos, Técnicas y Aplicaciones. Construido por Norberto Rodríguez Niño
¿Qué debemos responder con los modelos?
¿Cómo afectan las uniones y fusiones de empresas los retornos (rendimientos) de los inversionistas?
¿Debo invertir en títulos de Gobierno de largo plazo o títulos Privados de corto plazo?
Probar si el Modelo CAPM representa un modelo adecuado para la determinación de los retornos de un activo.
1. Complicadas de responder y
Econométrico
Estadísticos de error
Algunas técnicas de
combinación.
Procesos estocásticos
Pruebas de hipótesis
Inteligencia artificial
Clasificación de los Modelos Econométricos
Tipo de Efecto: Filosofía Estadística:
Lineales Vs No Lineales Frecuentista (Clásica) Vs Bayesiano
Tipo de Observaciones:
Series de Tiempo Vs Corte Transversal Vs Datos de Panel
Variable a Explicar:
Cuantitativa (Continua) Vs Cualitativa (Discreta)
Metodologías del Pronóstico y Modelado
Procesos estocásticos (Taxonomía):
Supuestos:
No Fraccionales *Fraccionales
(Black, Scholes and Merton, 1973) (Biagini and Oksendal, 2011), (Mandelbrot, 1972), (Taqqu,
Econometría (Taxonomía) Univariada:
Variables de interés:
Precios Tasas
(Hull and White, 1990) (Vasicek, 1977)
(Black, Scholes and Merton, 1973) (Cox, Ingersoll and Ross, 1985)
(Black and Scholes, 1976) (Hull and White, 1990)
(Cox, Ingersoll and Ross, 1985), …
Univariados Multivariados
Fuente: (Ariza, 2016) basado en (Granger y Teräsvirta, 1993) y (Jalil y Misas, 2006).
Series de Tiempo
Proceso estocástico es un conjunto de variables aleatorias asociadas a distintos instantes de tiempo.
Serie temporal es un conjunto de observaciones o medidas realizadas secuencialmente en intervalos predeterminados y de igual,
o aproximadamente igual, duración. Es una realización del proceso estadístico, es decir, es una observación de T variables
aleatorias ordenadas en el tiempo.
La relación entre una serie temporal y el proceso estocástico que la genera es la misma que hay entre una muestra y la variable
aleatoria de la que procede.
Las peculiaridades de una serie temporal (frente a una muestra) y de un proceso estocástico (frente a una variable aleatoria) son:
1) Las series temporales y los procesos estocásticos están referidos a instantes de tiempos concretos y 2) los datos están
ordenados.
El objetivo del análisis de series temporales es inferir la forma del proceso estocástico a partir de las series temporales que
genera.
X
100
-100
0
-80
-60
-40
-20
20
40
80
60
1
14
27
40
53
66
79
92
105
118
131
144
157
170
183
196
209
222
235
248
261
274
287
300
313
Series de Tiempo
326
339
352
365
378
391
404
417
430
443
456
469
482
495
508
Tiempo
Trayectorias
521
534
547
560
573
586
599
612
625
638
651
664
677
690
703
716
729
742
755
768
781
794
807
820
833
846
859
872
Ejemplo de proceso estocástico y serie de tiempo: 35 realizaciones de paseos aleatorios de tamaño 1000.
885
898
911
924
937
950
963
976
989
Patrones de una Serie de Tiempo
Se busca responder la siguiente pregunta: ¿Por qué la serie no se comporta de la siguiente
manera?
10
7 Por:
6 •Tendencia
•Estacionalidad
Xt
5
•Ciclicidad
4
•Aleatoriedad
3 •Intervenciones-outliers
2
0
1 2 3 4 5 6 7 8 9 10
Tiempo
Patrones de una Series de Tiempo
Tendencia 𝑇𝑡
20,000
La tendencia representa el comportamiento predominante
de la serie. Esta puede ser definida como el cambio de la
16,000
media a lo largo de un periodo.
Son movimientos a lo largo de una serie de tiempo, estos 12,000
movimientos son de largo plazo. La tendencia es el
componente que representa el crecimiento (o la declinación) 8,000
subyacente en una serie de tiempo, durante un periodo
extenso. Para una serie de tiempo con tendencia, el nivel de 4,000
la serie no es contante, en otras palabras, es una serie no
estacionaria. La tendencia puede ser determinística o
estocástica. 0
M3 M4 M5 M6 M7 M8 M9 M10 M11 M12
2017
Bitcoin Tendencia
Patrones de una Serie de Tiempo Year % Change GDP
20
Ciclo 𝐶𝑡 : Se refiere a oscilaciones alrededor de la tendencia y son de
larga duración, períodos mayores de un año. Estas oscilaciones 16
periódicas no son regulares (diferencias en duración e intensidad) y se 12
presentan en los fenómenos económicos cuando se dan de forma
alternativa etapas de prosperidad o de depresión. Los patrones 8
0
2012 2013 2014 2015 2016 2017
ALEATORIO
Irregular, 𝐼𝑡 : patrón intrínseco de la serie , es un componente de corto
1.0
plazo que captura las fluctuaciones impredecibles o aleatorias que se
presentan por sucesos inusuales y no corresponden a los tres 0.8
componentes antes mencionados, por lo tanto, su comportamiento es
un efecto residual de la serie de tiempo. Son movimientos erráticos 0.6
0.2
0.0
1980 1985 1990 1995 2000 2005 2010 2015
Modelo
𝑦𝑡+ℎ = 𝑓 𝐼𝑡 + 𝑒𝑡+ℎ
𝑦ො𝑡+ℎ = 𝑓 𝐼𝑡 ≅ 𝐸[𝑦𝑡+ℎ |𝐼𝑡 ]
1
MAD “Desviación media absoluta”: Mide la exactitud del 𝑀𝐴𝐷 =
𝑛
𝑌𝑡 − 𝑌𝑡
pronóstico, promediando la magnitud de los errores.
1 2
𝑀𝑆𝐸 = 𝑌𝑡 − 𝑌𝑡
MSE “Error cuadrático medio”: Sanciona errores grandes en 𝑛
la elaboración de pronósticos.
1 2
𝑅𝑀𝑆𝐸 = 𝑌𝑡 − 𝑌𝑡
𝑛
RMSE “Raiz cuadrada MSE”
¿Cómo evaluar un modelo?
𝑅𝑀𝑆𝐸
𝑈 − 𝑇𝐻𝐸𝐼𝐿1 =
1 𝑛 1 𝑛 2
σ𝑡=1 𝑌𝑡2 + σ 𝑌
𝑛 𝑛 𝑡=1 𝑡
Coeficiente de desigualdad de Theil: Permite analizar la
bondad de ajuste del modelo. Un coeficiente cercano a cero, 2
1 𝑌𝑡+1 − 𝑌𝑡+1
indica que la técnica usada es mejor que el método naive. σ𝑛−1
𝑛 − 1 𝑡=1 𝑌𝑡
𝑈 − 𝑇𝐻𝐸𝐼𝐿2 = 2
1 𝑌𝑡+1 − 𝑌𝑡
σ𝑛−1
𝑡=1
𝑛−1 𝑌𝑡
Medidas de Precisión
1. Medidas Dependientes de Escala
a) MSE (Mean Square Error)
Se define MSE (Mean Square Error) como la media de 𝑒𝑡2 , es decir el promedio de los errores entre el estimador y lo que se
estima al cuadrado:
1
𝑀𝑆𝐸 = 𝑛 σ𝑛𝑡=1(𝑦𝑡 − 𝑦ො𝑡 )2
Donde 𝑛 es el número de muestras y 𝑦ො𝑡 es la estimación de 𝑦𝑡 . De la fórmula anterior se deduce que la función de pérdida de la
medida es la cuadrática o error medio al cuadrado.
Características Desventajas
• EL MSE es el segundo momento del error y por lo tanto relaciona la varianza • Por su fórmula en sí, es una medida sensible a valores estimados
del estimador así como su sesgo: Entre más pequeño es el MSE más se atípicos quizás con poca frecuencia de ocurrencia. Esto arrojará un valor
ajusta el estimador a los datos reales. superior en la diferencia con el dato real que se incrementará con la
• El elevar las diferencias al cuadrado hace que los datos negativos y positivos potencia cuadrada y por ende, tendrá un peso en el cálculo del promedio
no se cancelen entre sí. Adicionalmente, al ser de naturaleza cuadrática, haciéndola poco confiable.
otorga mayor peso a aquellos errores de mayor tamaño siendo útil en los • Por la diferencia de unidades en relación con los datos originales es
casos en los que el pronóstico implica una valoración de los errores de esta difícil de interpretar.
manera pero no en aquellos donde no se dé relevancia a lo anterior.
• Las unidades del MSE no son las mismas de los datos ni del estimador.
• Toma valores entre 0 y ∞.
Medidas de Precisión
1. Medidas Dependientes de Escala
b) RMSE (Root Mean Square Error)
Se define RMSE (Root Mean Square Error) como la raíz cuadrada de la media de los errores al cuadrado:
2 2 1 𝑛 2
𝑅𝑀𝑆𝐸 = 𝑀𝑆𝐸 = σ 𝑦𝑡 − 𝑦ො𝑡
𝑛 𝑡=1
Donde n es el número de muestras, 𝑦ො𝑡 corresponde a los valores observados de 𝑦𝑡 y 𝑦𝑡 se modela en valores en tiempo o lugar t.
La función de pérdida de la medida es la cuadrática o error medio al cuadrado.
Características Desventajas
• La raíz del error cuadrático medio (RMSE) también llamado desviación • Se debería evitar el uso de del RMSE cuando la evaluación de error es
cuadrática media es una medida de uso frecuente de la diferencia entre los tan crudo que hay valores atípicos (grandes errores de medición).
valores pronosticados por un modelo y los valores realmente observados. Estos valores tendrán un fuerte efecto en la medida en que se elevan
Estas diferencias individuales son también llamadas residuos y el RMSE al cuadrado. Al igual que la MSE, RMSE es una herramienta muy
sirve para agregar en una sola medida la capacidad de predicción. popular por su relevancia teórica en la modelación estadística, sin
embargo, varios autores las han rechazado precisamente por su
• El RMSE es más apropiado que el MAE para representar el rendimiento del sensibilidad a valores atípico.
modelo cuando se espera que la distribución de error sea gaussiana. La
diferencia con la medida MSE es que el resultado está en las unidades
originales de la información histórica.
Medidas de Precisión
1. Medidas Dependientes de Escala
c) MAE (Mean Absolute Error)
Se define MAE (Mean Absolute Error) como la magnitud promedio de los errores de un ejercicio de pronóstico sin tener en cuenta su
signo, es decir, el promedio de los valores absolutos de los errores calculados:
1
𝑀𝐴𝐸 = 𝑛 σ𝑛𝑡=1 𝑦𝑡 − 𝑦ො𝑡
Donde 𝑛 es el número de muestras y 𝑦ො𝑡 es la estimación de 𝑦𝑡 . La función de pérdida de la medida es la del error absoluto.
Características Desventajas
• MAE arroja un número que puede ser directamente interpretado puesto • Puesto que la mayoría de modelos tienen una asunción en el sentido que
que la pérdida se encuentra en las mismas unidades de la variable de los errores se encuentran distribuidos como una normal y no como una
salida. función uniforme, es posible encontrar métricas que se ajustan de una
• El peso asignado a cada uno de los errores calculados es el mismo. mejor manera a los datos: Este es el caso por ejemplo de RMSE.
• El uso de esta medida es aconsejable para describir errores • Un importante aspecto en las métricas de error es su capacidad de
uniformemente distribuidos. discriminar entre los resultados del modelo. Cuando se utiliza MAE, los
• El hecho mismo de ser una medida absoluta podría convertirse en una resultados podrían estar afectados por una gran cantidad de valores de
desventaja, sin embargo, por no ser de naturaleza cuadrática, recibe error promedio sin necesariamente reflejar errores de gran tamaño.
menos influencia de valores atípicos. • Por la inclusión de valores absolutos en su cálculo, el uso de MAE podría
• Toma valores entre 0 y ∞. significar dificultades en los cálculos de la sensibilidad del valor de MAE
con respecto a los parámetros del modelo en cuestión.
Medidas de Precisión
2. Medidas Basadas en Porcentaje
a) MAPE (Mean Absolute Percentage Error)
MAPE (Mean Absolute Percentage Error) mide el tamaño del error en términos porcentuales lo cual lo hace no dependiente de la
escala. Se calcula como el promedio de los errores porcentuales sin tener en cuenta el signo:
1 𝑦𝑡 −𝑦ො𝑡
𝑀𝐴𝑃𝐸 = σ𝑛𝑡=1
𝑛 𝑦𝑡
Donde 𝑛 es el número de muestras, 𝑦𝑡 es el valor actual y 𝑦ො𝑡 es la estimación. La función de pérdida de la medida es la del error absoluto.
Características Desventajas
• .El uso de esta métrica está asociado a series de tiempo homogéneas e • Por la fórmula misma, si hay valores en cero, esto significará una división
igualmente espaciadas. entre cero. A pesar que lo anterior se soluciona desestimando aquellos
• La métrica es sensible a la escala y no debe ser utilizada en casos donde datos en cero, varios problemas podrían surgir cuando se tienen valores
hay un bajo nivel de datos. de 𝑦𝑡 muy pequeños y 𝑦ො𝑡 grandes ya que esto redunda en valores de
• Puesto que está dado en términos porcentuales, es más fácil de entender MAPE extremadamente grandes que podrían hacer las comparaciones
que los valores arrojados por otras métricas y por ello, es común que inútiles. De esta manera, casos en los cuales donde el valor cero es
MAPE sea usada para comparar diferentes modelos de pronóstico con importante, por ejemplo pronósticos de temperaturas en grados
conjuntos de datos diferentes. Fahrenheit o Centígrados, este tipo de medidas podría no ser de las
• La métrica tiene propiedades estadísticas valiosas por cuanto usa todas las preferidas para la comparación de modelos.
observaciones y tiene la más pequeña variabilidad de muestra a muestra • Un mismo valor de error puede significar un porcentaje diferente: Casos
• Toma valores entre 0 y ∞. en que Si 𝑦𝑡 es mayor que 𝑦ො𝑡 , esto arrojará un porcentaje más pequeño
que cuando 𝑦𝑡 es menor que 𝑦ො𝑡 .
Medidas de Precisión
3. Estadístico U de Theil
Henri Theil propuso dos medidas de error en diferentes momentos. El estadístico U1 hace referencia a una medida de exactitud mientras que el U2
hace referencia a una medida de calidad del pronóstico:
2
σ𝑛 2 1 𝑌𝑡+1 − 𝑌𝑡+1
𝑡=1 𝑦𝑡 −𝑦ො𝑡 σ𝑛−1
𝑈2 − 𝑇𝐻𝐸𝐼𝐿 = 𝑛 − 1 𝑡=1 𝑌𝑡
𝑈2 − 𝑇𝐻𝐸𝐼𝐿 =
σ𝑛 2 𝑛 ො𝑡 2
𝑡=1 𝑦𝑡 + σ𝑡=1 𝑦 1 𝐹𝑁𝑡 − 𝑌𝑡+1 2
σ𝑛−1
𝑡=1
𝑛−1 𝑌𝑡
Donde 𝑛 es el número de muestras, 𝑦𝑡 es el valor actual, 𝑦ො𝑡 es la estimación del modelo y 𝐹𝑁𝑡 es el pronóstico seleccionado de comparación que
suele ser el de caminata aleatoria o el modelo ingenuo o naive.
El U1 tiene poco valor como un índice de la exactitud de un pronóstico: Sin importar si se trabaja con datos absolutos o deltas de cambio, los
valores serán delimitados entre 0 (el mejor caso) y 1 (el peor caso).
Características Desventajas
• El estadístico U2 toma valores entre 0 y ∞. Un valor de 1 significa que la • El estadístico U de Theil es altamente influenciado por los valores
exactitud del modelo de pronóstico seleccionado es la misma que el atípicos. En el límite inferior cuando el numerador de la expresión es
modelo de referencia. Un valor por debajo de 1 significa que el modelo cercano a cero, su cuadrado será aún más cercano a cero. Por el
es mejor que el de referencia y un valor mayor a 1 significa lo opuesto: contrario, en el límite superior, cuando 𝑦𝑡 y 𝐹𝑁𝑡 tienden a cero, el
estadístico tendrá una tendencia hacia infinito.
Procesos de Validación y Ajuste
|I 𝑇 ]
𝐸[𝑌𝑇+ℎ
Donde:
h es el horizonte de pronóstico
AJUSTE VALIDACION
RMSE MAD MAPE RMSE MAD MAPE
m=2 122,918785 96,3168519 4,4844% 56,4620724 47,7366667 2,5238%
m=3 139,191153 110,044088 5,1215% 44,2317593 39,4983333 2,1119%
m=6 175,288553 139,843833 6,6358% 58,6980368 43,9161111 2,3992%
m=12 234,829011 198,30303 9,5102% 86,1648938 74,4141667 4,0374%
α=0,1 196,349289 166,007529 7,9354% 132,492088 125,168817 6,7540%
α=0,3 149,663603 121,523721 5,6984% 49,2514166 39,4983333 2,1477%
α=0,5 124,909581 99,7900581 4,6591% 44,9519512 39,5684481 2,1120%
α=0,7 112,143516 88,1438239 4,1179% 53,8701258 46,3333863 2,4530%
α=0,9 105,610935 80,9488088 3,7920% 61,0510205 51,7475282 2,7333%
Los métodos de pronóstico dependen del tipo de Métodos basados en la teoría estadística y
patrones de datos que posea la variable objeto de econométrica de las series de tiempo. Propuesto por
estudio. Estos patrones pueden ser de tendencia, los estadísticos George E. P. Box y Gwilym Jenkins
estacionales y aleatorios, principalmente. Algunos 1970-1976.
modelos son:
Promedios móvil simple y doble. Suavización
exponencial simple, doble, de Holt-Winters no
estacional y Holt-Winters estacional (aditivo y
multiplicativo)
Métodos de Suavización
Trabajan mejor con los datos estables, no maneja muy bien la tendencia o la estacionalidad.
Mientras más grande es el orden del MA utilizado, mayor es el efecto del suavizamiento, pero como
pronóstico coloca muy poca atención a las fluctuaciones.
𝑌𝑡 + 𝑌𝑡−1 + ⋯ 𝑌𝑡−𝑚+1
𝑀𝑡 = Ajuste k=1
𝑚
Validación Pronóstico
k=#Valores futuros a pronosticar
t=último dato ajustado
𝑌𝑡+𝑘 = 𝑀𝑡
Métodos de Suavización
Se basa en promediar o suavizar los valores pasados de una serie de tiempo de una manera decreciente o
exponencial.
Las ponderaciones utilizadas son para el valor más reciente, (1- ) para el siguiente valor más reciente, (1-
)2 para el siguiente y así sucesivamente.
Trabajan mejor con los datos estables, no maneja muy bien la tendencia o la estacionalidad
Validación Pronóstico
𝑉𝑎𝑙𝑜𝑟 𝐼𝑛𝑖𝑐𝑖𝑎𝑙: 𝐴𝑜 = 𝑋1 k=#Valores futuros a pronosticar
t=último dato ajustado
𝑀𝑜𝑑𝑒𝑙𝑜: 𝑌𝑡+𝑘 = 𝐴𝑡
Métodos de Suavización
Trabajan mejor con datos con tendencia aprox lineal, sin estación
𝑌𝑡+𝑘 = 𝑎𝑡 + 𝑘𝑏𝑡
Métodos de Suavización
Permite revisar continuamente el pronóstico a la luz de los nuevos datos actualizados cuando se presenta una
tendencia aprox Lineal, sin estacionalidad.
Modelo de dos parámetros, este método suaviza la estimación de la tendencia de la serie de tiempo.
𝒕+𝒌 = 𝑨𝒕 + 𝑻𝒕 𝒌
𝒀
𝑻𝒕 = 𝜷 𝑨𝒕 − 𝑨𝒕−𝟏 + (𝟏 − 𝜷)𝑻𝒕−𝟏
El método de suavización exponencial lineal y estacional de tres parámetros de Winters, es una extensión del
método de Holt que podría representar mejor los datos y reducir el error del pronóstico cuando existe un patrón de
estacionalidad. En el método de Winters se emplea una ecuación adicional para estimar la estacionalidad.
𝐸𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑙𝑖𝑑𝑎𝑑 = 𝑆𝑡 = 𝛾 𝑌𝑡 − 𝐴𝑡 + 1 − 𝛾 𝑆𝑡−𝑠
𝑌𝑡+𝑘 = 𝐴𝑡 + 𝑇𝑡 𝑘 + 𝑆𝑡+𝑘−𝑠
Métodos de Suavización
𝒀𝒕
𝑨𝒕 = 𝜶 + (𝟏 − 𝜶)(𝑨𝒕−𝟏 + 𝑻𝒕−𝟏 )
𝑺𝒕−𝒔
𝑻𝒕 = 𝜷 𝑨𝒕 − 𝑨𝒕−𝟏 + (𝟏 − 𝜷)𝑻𝒕−𝟏
𝒀𝒕
𝑺𝒕 = 𝜸 + (𝟏 − 𝜸)𝑺𝒕−𝒔
𝑨𝒕
s, longitud de la estacionalidad o duración de la estacionalidad
𝑇𝑡 , estimado de tendencia
𝑆𝑡 , estimado de estacionalidad, es equivalente a suavizar los valores previos y actuales del índice estacional.
𝑌𝑡
, índice estacional que crea una razón que se puede usar de manera multiplicativa para ajustar un pronóstico que toma en cuenta los picos y valles.
𝐴𝑡
𝑌𝑡
, ajuste de Yt por estacionalidad, eliminando así los efectos estacionales que pudiera existir en los datos originales.
𝑆𝑡−𝑠
Resumen de Modelos
Proceso Estacionario
Un proceso estocástico es estacionario en sentido estricto Un proceso estocástico es estacionario en sentido débil si los
o fuerte cuando la distribución de probabilidad conjunta de momentos del primero y segundo orden de la distribución
cualquier parte de la secuencia de variables aleatorias es (esperanzas, varianzas, covarianzas) no dependen del tiempo.
invariante del tiempo.
𝐸 𝑥𝑡 = 𝜇, 𝜇 < 𝛼, ∀𝑡
𝐹 𝑥𝑡 , 𝑥𝑡+1 , … , 𝑥𝑡+𝑘 = 𝐹 𝑥𝑡+𝜏 , 𝑥𝑡+1+𝜏 , … , 𝑥𝑡+𝑘+𝜏 𝐸 (𝑥𝑡 − 𝜇𝑡 )2 = 𝜎 2 < 𝛼, ∀𝑡
𝐸 (𝑥𝑡 − 𝜇𝑡 )(𝑥𝑡+𝜏 − 𝜇𝑡+𝜏 ) = 𝛾𝜏, 𝛾𝜏, < 𝛼, ∀𝑡, 𝜏
𝐶𝑜𝑣 𝑥𝑡 , 𝑥𝑡+𝜏 = 𝐶𝑜𝑣 𝑥𝑡±𝑟 , 𝑥𝑡+±𝑟+𝜏 = 𝛾𝜏
Modelos univariados de Series de Tiempo
𝛾𝜏 = 𝛾−𝜏
𝛾0 = 𝜎 2
𝛾0
𝜌0 = =1
𝛾0
Modelos univariados de Series de Tiempo
𝑇
𝜀𝑡 𝑡=1 → Es un proceso 𝐑𝐮𝐢𝐝𝐨 𝐁𝐥𝐚𝐧𝐜𝐨 si:
𝐸 𝜀𝑡 = 0, ∀𝑡
𝐸 𝜀𝑡2 = 𝑉 𝜀𝑡 = 𝜎𝜀2 , ∀𝑡
𝐸 𝜀𝑡 , 𝜀𝑡+𝜏 = 𝛾𝜏 = 0, ∀𝑡,𝜏 ≠ 0
1 si 0
Es el proceso mas aleatorio que existe. Es por construcción estacionario.
Es una colección de variables aleatorias con media cero y no
0 si 0
correlacionadas entre ellas.
Un proceso ruido blanco no es posible pronosticar utilizando modelos 1
ARIMA. Un proceso Ruido Blanco no tiene memoria, es decir, que el
último dato conocido recoge toda la información histórica disponible. 0
Paseo aleatorio, un paseo aleatorio representa una variable cuyos 𝜏
cambios son ruido blanco y, por tanto, imprevisibles. La característica -1
fundamental de este proceso es la falta de afinidad de las series a una
media estable.
Modelos univariados de Series de Tiempo
𝑇
𝑥𝑡 𝑡=1 → Es un proceso de 𝐂𝐚𝐦𝐢𝐧𝐚𝐭𝐚 𝐀𝐥𝐞𝐚𝐭𝐨𝐫𝐢𝐚 si:
Caminata Aleatoria
2 (t )
t ,
2t 2 (t )
xt t
𝑥𝑡 = 𝛼𝑥𝑡−1 + 𝜀𝑡
𝑥𝑡 − 𝛼𝑥𝑡−1 = 𝜀𝑡
Operador de rezago 𝑳 :
(1 − 𝛼𝐿)𝑥𝑡 = 𝜀𝑡
Lxt xt 1
Polinomio de rezago
L xt xt k
k
𝑅𝑢𝑖𝑑𝑜 𝐵𝑙𝑎𝑛𝑐𝑜 𝑠𝑖 𝛼 = 0
𝐶𝑎𝑚𝑖𝑛𝑎𝑡𝑎 𝐴𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑠𝑖 𝛼 = 1 𝑁𝑜 𝐸𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑜 ; 1 − 𝐿 = 0; 𝐿 = 1 →
Una Raiz Unitaria
Explosivo no estacionario si α > 1
Estacionario si α < 1
Modelos univariados de Series de Tiempo
¿Como detectar si una serie sigue un proceso de ruido blanco o si presenta raíz o raíces unitarias?
Modelos univariados de Series de Tiempo
Una serie se considera ruido blanco si las autocorrelaciones se encuentran dentro del anterior intervalo.
Modelos univariados de Series de Tiempo
𝐻𝑜 : 𝜌1 = 𝜌2 = 𝜌3 = ⋯ = 𝜌𝑘 = 0 𝑅𝑢𝑖𝑑𝑜 𝐵𝑙𝑎𝑛𝑐𝑜
𝐻1 : ∃𝜌𝑖 ≠ 0 ; 𝑖 = 1, … , 𝑘; 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑛𝑜 𝑒𝑠 𝑅𝑢𝑖𝑑𝑜 𝐵𝑙𝑎𝑛𝑐𝑜
𝑘
𝑘
𝑟𝑖2
𝐿𝐵 = 𝑄𝑘 = 𝑛(𝑛 + 2)
𝑛−𝑖
𝑖=1
Una serie se considera ruido blanco si los p-values son mayores que el nivel de significancia de la prueba.
En la práctica, desde que no sean los primeros rezagos, se permite que sea mayor el p-value en uno de cada 20 rezagos
para considerar la serie ruido blanco.
Modelos univariados de Series de Tiempo
Tal y como se ha señalado, la aplicación de la metodología ARIMA precisa la utilización de series económicas estacionarias en
varianza y en media. La presencia de una raíz unitaria en una serie de tiempo económica revela directamente inestabilidad de la
misma, siendo necesario transformarla para poder trabajarla con ella.
Cuando una serie no es estacionaria en media, o lo que es lo mismo, cuando no es integrada de orden cero I(0), se dice que
presenta al menos una raíz unitaria. Cuando esto ocurre, sabemos que es posible la obtención de una serie estacionaria mediante
una sencilla transformación de la serie original, como es la diferenciación adecuada. Pues bien, el número de diferencias que
habrá que tomar en la serie para convertirla en estacionaria en media viene dado, justamente, por el número de raíces unitarias
que la serie original presente.
Si se parte del modelo: 𝑥𝑡 = 𝛼𝑥𝑡−1 + 𝜀𝑡 y 𝛼 = 1 existe una raíz unitaria, no estacionariedad en varianza.
2 2 2
𝜎𝑥2𝑡 = 𝛼 2 𝜎𝑥2𝑡−1 + 𝜎𝜀2 → 𝜎𝑥2𝑡 − 𝛼 2 𝜎𝑥2𝑡 = 𝜎𝜀2 → 𝜎𝑥𝑡 (1 − 𝛼 ) = 𝜎𝜀
𝜎𝜀2 Si 𝛼 = 1, el proceso no es estacionaria (raíz unitaria)
𝜎𝑥2𝑡 = remediable. Si 𝛼 > 1, proceso explosivo. Si 𝛼 < 1, proceso
(1 − 𝛼 2 )
estacionario.
Modelos univariados de Series de Tiempo
𝑥𝑡 = 𝛼𝑥𝑡−1 + 𝜀𝑡
𝑥𝑡 − 𝑥𝑡−1 = 𝛼𝑥𝑡−1 − 𝑥𝑡−1 + 𝜀𝑡
∆𝑥𝑡 = 𝑥𝑡−1 𝛼 − 1 + 𝜀𝑡 ; 𝛼 − 1 = 𝜙
∆𝑥𝑡 = 𝜙𝑥𝑡−1 + 𝜀𝑡 ; 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑎𝑢𝑥𝑖𝑙𝑖𝑎𝑟
𝑝
∆𝑥𝑡 = 𝑎 + 𝑏𝑡 + 𝜙𝑥𝑡−1 + σ𝑖=2 𝜂𝑖 ∆𝑥𝑡−𝑖+1 + 𝜀𝑡 ; Dickey Fuller Aumentado
• Estadístico t, pero contra una distribución simulada distinta (la verdadera distribución ya no es
DF t-Student, sino que sigue un cociente de procesos de Wiener).
Dickey-Fuller • La hipótesis nula es que hay una raíz unitaria.
• Supone que el término de perturbación es ruido blanco.
En el test ADF el número de rezagos a utilizar de las variaciones de la variable en la regresión auxiliar es
determinado por el criterio de información Bayesiano de Schwarz.
𝑛 𝑒 ′𝑒
Logaritmo de Máxima Verosimilitud L=− (1 + 𝐿𝑜𝑔 2𝜋 + 𝐿𝑜𝑔 )
2 𝑛
El estadístico AIC, propuesto por Akaike (1974) y el estadístico SC propuesto por Schwarz (1978) y basado en la teoría
de la información, siguen el siguiente cálculo:
2𝑙 2𝑘
Criterio de Información Akaike 𝐴𝐼𝐶 = − +
𝑛 𝑛
2𝑙 (𝑘𝐿𝑜𝑔𝑛)
Criterio de Información Schwarz 𝑺𝑪 = − +
𝑛 𝑛
Los estadísticos AIC y SC, a diferencia de los coeficientes de determinación, indican mejores ajustes cuanto más bajos
sean sus valores.
El resultado final del test de estacionariedad es determinar si la serie es estacionaria o no y establecer el número
de diferenciaciones 𝒅 necesarias para que la serie sea estacionaria. Establecer el orden de integración 𝑰 𝒅 .
Modelos univariados de Series de Tiempo
Procesos Integrados
Los procesos no estacionarios más importantes son los procesos integrados, estos procesos tienen la
propiedad fundamental de que al diferenciarse se obtienen procesos estacionarios.
Una propiedad importante que diferencia a los procesos integrados de los estacionarios es la forma en
que desaparece la dependencia con el tiempo.
.1
-.2
-.3
49 50 51 52 53 54 55 56 57 58 59 60
Modelos ARIMA(p,d,q)
𝐴𝑅 𝑝 , Autorregresivo de orden p.
MA 𝑞 , media móvil de orden q.
𝐴𝑅𝑀𝐴 𝑝, 𝑞 , 𝐴𝑢𝑡𝑜𝑟𝑒𝑔𝑟𝑒𝑠𝑖𝑣𝑜 𝑑𝑒 𝑚𝑒𝑑𝑖𝑎 𝑚ó𝑣𝑖𝑙.
Para series que no son estacionarias 𝐼(𝑑) , que evidencian al menos una raíz unitaria,
específicamente 𝑑 raíces unitarias, 𝑑 diferenciaciones para que la serie sea estacionaria.
Para saber el valor de d se utilizan los test de raíces unitarias (ADF,PP, KPSS..).
Modelos ARIMA(p,d,q)
𝑋𝑡 = 𝑓 𝐼𝑡−1 + 𝜀𝑡 , si 𝑑 = 0.
Δ𝑋𝑡 = 𝑓 𝐼𝑡−1 + 𝜀𝑡 , si 𝑑 = 1.
Δ2 𝑋𝑡 = 𝑓 𝐼𝑡−1 + 𝜀𝑡 , si 𝑑 = 2.
…
Hasta el momento 𝑡 − 1 se tiene los valores pasados de la serie y las innovaciones pasadas.
Hay tres posibles procesos generadores:
𝐴𝑅 𝑝 ; ∅𝑝 𝐿 𝑋𝑡 = 𝛿 + 𝜀𝑡 → ∅𝑝 𝐿 = 1 − ∅1 𝐿 − ∅2 𝐿2 − ⋯ − ∅𝑝 𝐿𝑝
𝑀𝐴 𝑞 ; 𝑥𝑡 = 𝛿 + 𝜃𝑞 𝐿 𝜀𝑡 → 𝜃𝑞 𝐿 = 1 − 𝜃1 𝐿 − 𝜃2 𝐿2 − ⋯ − 𝜃𝑞 𝐿𝑞
𝐴𝑅𝑀𝐴 𝑝, 𝑞 ; ∅𝑝 𝐿 𝑋𝑡 = 𝛿 + 𝜃𝑞 𝐿 𝜀𝑡
Modelos ARIMA(p,d,q)
Recordemos:
Función de Autocorrelación Simple (FAC)
𝑀𝑒𝑑𝑖𝑎 𝜇 → 𝑥ҧ = 𝑇 −1 𝑥𝑡
AUTOCORRELOGRAMA 𝑡=1
𝑇
𝛾ො𝜏
𝐴𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝜌𝜏 → 𝜌ො𝜏 = 𝛾𝜏 → 𝑟𝜏 =
𝛾ො0
Se considera que 𝜌𝜏 es diferente de cero si 𝑟𝜏 esta fuera del intervalo (-1.96𝜎𝑟𝜏 , +1.96𝜎𝑟𝜏 ) con una confianza del 95%. 𝜎𝑟𝜏
es la desviación estándar de las autocorrelaciones muestrales, el cual se puede asumir como (1/T) bajo ruido blanco.
Modelos univariados de Series de Tiempo
xt 0 11 xt 1 vt
Se puede estimar a través regresiones o xt 0 21 xt 1 22 xt 2 vt
ecuaciones de Yule-Walker. Vía regresiones sería:
xt 0 k1 xt 1 k 2 xt 2 ... kk xt k vt
Donde ∅ 11 , … , ∅
𝑘𝑘 son estimaciones consistentes de la FACP. Bajo los supuestos: proceso gaussiano y ∅𝑘𝑘 =
∅𝑘+1,𝑘+1 = ⋯ = 0, se puede estimar la varianza con, 𝑉 ∅ 𝑘𝑘 ≅ 1 , de manera que si ∅
𝑘𝑘 esta fuera del intervalo
𝑇
(-1.96𝑇 −1/2 ,+1.96 𝑇 −1/2 ) se considera que ∅ 𝑘𝑘 ≠ 0, con una confianza del 95%.
Modelos Autorregresivos de orden: AR(p)
∅𝑝 𝐿 𝑥𝑡 = 𝛿 + 𝜀𝑡
1 − ∅1 𝐿 − ∅2 𝐿2 − ⋯ − ∅𝑝 𝐿𝑝 𝑥𝑡 = 𝛿 + 𝜀𝑡
Para que un proceso AR sea estacionario, los inversos de las raíces del polinomio de rezago asociado:
∅𝑝 𝐿 = 1 − ∅1 𝐿 − ∅2 𝐿2 − ⋯ − ∅𝑝 𝐿𝑝 = 0
= 𝛿 + 𝜃𝑞 (𝐿)𝜀𝑡
1 − ∅1 𝐿 − ⋯ − ∅𝑝 𝐿𝑝 𝑥𝑡 = (1 − 𝜃1 𝐿 − ⋯ − 𝜃𝑞 𝐿𝑞 )𝜀𝑡
Los inversos de las raíces de los polinomios de rezago asociados con los componentes AR y
MA deben ser menores que uno para asegurar estacionariedad e invertibilidad.
Modelo ARMA(1,1)
Un 𝐴𝑅𝑀𝐴(1,1) = 𝐴𝑅𝐼𝑀𝐴(1,0,1):
𝑥𝑡 = 𝛿 + ∅1 𝑥𝑡−1 − 𝜃1 𝜀𝑡−1 + 𝜀𝑡
Modelos ARMA(p,q)
Si alguno de los supuestos requeridos en los pasos 6 y/o 7 no se logran, hay que volver al paso 4.
Estacionalidad y Procesos Estacionales
Una serie temporal es estacional si tiende a repetir una pauta de comportamiento cada periodo
estacional denotado por “s”.
Suponemos que el periodo estacional es un año, por lo que si la serie es mensual, el periodo
estacional es s=12, ya que 12 meses es el número de observaciones que forman el ciclo
estacional.
La estacionalidad hace que la media de las observaciones no sea constante, pero evoluciona de
forma previsible de acuerdo con un patrón cíclico.
Forma de Corrección:
De la misma forma que tomar diferencias regulares induce estacionariedad en la parte regular
(no estacional) de una serie, tomar la primera diferencias estacional inducirá estacionariedad en
la parte estacional.
Estacionalidad y Procesos Estacionales
• Las series mensuales y trimestrales, generalmente presentan dependencia con las
observaciones previas, pero también con las que ocurrieron hace un año.
• Dada esa dependencia estacional, la función de autocorrelación de los modelos mostrará una
dependencia temporal larga que conducirá a modelos con valores altos de p y q.
• Se simplificará con el uso de modelos multiplicativos.
• La estacionalidad puede ser de carácter estacionario o no estacionario.
Estacionalidad y Procesos Estacionales
• Recuerde que si la magnitud de las fluctuaciones estacionales no es proporcional al nivel de la serie, el efecto estacional es
aditivo, mientras que si las fluctuaciones estacionales son proporcionales al nivel de la serie, el efecto estacional es
multiplicativo.
• El conjunto de datos mensuales, por ejemplo, inicio de la vivienda, tienen un fuerte componente estacional.
• En un modelo ARIMA estacional, usamos un segundo proceso ARMA para modelar las fluctuaciones estacionales. Para los
datos mensuales de inicio de la vivienda, usaríamos un proceso ARMA para modelar las fluctuaciones mes a mes y un
segundo proceso ARMA para modelar la variación estacional; un modelo ARIMA estacional aditivo se denomina así porque
los dos procesos se suman. Por ejemplo, digamos que el modelo de vivienda comienza ht como:
ℎ𝑡 = 𝛼 + 𝜃1 ℎ𝑡−1 + 𝜃12 ℎ𝑡−12 + 𝜃24 ℎ𝑡−24 + 𝑒𝑡 + 𝛽1 𝑒𝑡−1 + 𝛽12 𝑒𝑡−12 + 𝛽24 𝑒𝑡−24
• Esa expresión ilustra la diferencia clave entre los modelos ARIMA estacional y multiplicativo. Obsérvese la presencia del
decimotercero rezago tanto en el término autorregresivo como en el promedio móvil, con su coeficiente limitado a ser el
producto de los coeficientes del primer rezago y duodécimo.
• En general, podemos escribir un modelo ARIMA estacional multiplicativo que permita la diferenciación regular y estacional
de la variable dependiente como:
Recordemos que una serie temporal es estacional si tiende a repetir una pauta de
comportamiento cada periodo estacional denotado por “s”.
SARIMA p, d , q P, D, Q s
AR(p) I(d) MA(q)
∅𝑝 𝐿 Φ 𝐿𝑠 (1 − 𝐿)𝑑 (1 − 𝐿𝑠 )𝐷 𝑥𝑡 = 𝛿 + 𝜃𝑞 (𝐿)𝞗 𝐿𝑠 𝜀𝑡
SAR(P) I(D) SMA(Q)
1 − 0.3𝐿 1 − 0.2𝐿12 𝑥𝑡 = 𝜀𝑡
1 − 0.3𝐿 − 0.2𝐿12 + 0.3 ∗ 0.2𝐿13 𝑥𝑡 = 𝜀𝑡
𝑥𝑡 = 0.3𝑥𝑡−1 + 0.2𝑥𝑡−12 + 0.05𝑥𝑡−13 + 𝜀𝑡
Modelos SARIMA(p,d,q)(P,D,Q)xs
Como estrategia, para la parte regular (no estacional) se examina la mitad de la primera
estación y para la propuesta de los patrones estacionales solo se miran los múltiplos
estacionales: s, 2s, 3s, ….
𝑆𝐴𝑅𝐼𝑀𝐴(? , 0, ? )(1,0,0)12
𝑆𝐴𝑅𝐼𝑀𝐴(? , 0, ? )(0,0,1)12
Modelos SARIMA(p,d,q)(P,D,Q)xs
Para una serie con raíz unitaria en la parte regular y en la estación, se diferencia en los dos
componentes, lo que permite realizar la propuesta SARIMA. En EViews 𝑑(𝑋𝑡, 𝑑, 𝑠 ∗ 𝐷) .
𝑆𝐴𝑅𝐼𝑀𝐴(0,1,0)(1,0,0)12 .
La tendencia, generada en ocasiones por raíces unitarias, oculta en muchos casos la estacionalidad.
Modelos SARIMA(p,d,q)(P,D,Q)xs
𝑆𝐴𝑅𝐼𝑀𝐴(0,0,0)(1,1,0)12 .
Raíz unitaria estacional se asocia con caída lenta en los múltiplos estacionales.
Modelos SARIMA(p,d,q)(P,D,Q)xs
𝑆𝐴𝑅𝐼𝑀𝐴(0,1,0)(1,1,0)12 .
Raíz unitaria en la parte regular y en el componente estacional (gráficamente aunque se podría probar mediante Hegy
test). Se diferencia en ambos componentes previo a la propuesta del modelo.
Modelo-Volatilidad
• Aglomeración de la volatilidad.
• Reversión a la media.
• La volatilidad es asimétrica.
• Excesos de curtosis.
Características que pretende capturar los modelos de volatilidad.
• Aglomeración de la volatilidad.
Efectivamente, al observar graficas de series financieras, a menudo se observa que la
volatilidad no solo cambian en el transcurso del tiempo sino que, además, tiende
agruparse en clusters. Es decir, que grandes cambios en las variables tienden a ser
seguidos por grandes cambios de cualquier signo, mientras que pequeños cambios en
las variables tienden a ser seguidos de pequeños cambios de cualquier signo. Este
comportamiento sugiere que la volatilidad de los rendimientos de los activos
financieros existe un proceso de correlación serial que es además hererocedástico.
Características que pretende capturar los modelos de volatilidad.
• Reversión a la media.
La aglomeración de la volatilidad implica que a un periodo de alta volatilidad,
eventualmente, seguirá otro de volatilidad normal, y a un periodo de baja volatilidad
seguirá uno de volatilidad mas alta. La volatilidad tiende a revertirse a la media, en
otros términos, existe un nivel normal de volatilidad al cual esta retorna
eventualmente. Los pronósticos a largo plazo convergerán todos al nivel normal de
la volatilidad, sin importar cuando fueron hechos.
Características que pretende capturar los modelos de volatilidad.
• La volatilidad es asimétrica.
La volatilidad se comporta diferente frente a innovaciones positivas y negativas. No
reacciona de la misma manera frente a una gran alza en el precio de un activo que
frente a una caída en su precio.
Características que pretende capturar los modelos de volatilidad.
𝑌𝑡 = 𝛽0 + 𝑒𝑡
Donde:𝑒𝑡 ~𝑁(0, 𝜎𝑡2 )
2 2
𝜎𝑡2 = 𝛼0 + 𝛼1 𝜀𝑡−1 + 𝛼2 𝜀𝑡−2 2
+ ⋯ + 𝛼𝑝 𝜀𝑡−𝑞
𝑞
2
𝜎𝑡2 = 𝛼0 + 𝛼𝑖 𝜀𝑡−𝑖
𝑖=1
2
ARCH(1): 𝜎𝑡2 = 𝛼0 + 𝛼1 𝜀𝑡−1 𝛼0 > 0, 0 < 𝛼1 < 1
Observaciones de los modelos ARCH
• El primer parámetro indica la mínima varianza condicional.
2 2 2
𝜎𝑡2 = 𝛼0 + 𝛼1 𝜀𝑡−1 + 𝛾𝑑𝑡−1 𝜀𝑡−1 + 𝛽1 𝜎𝑡−1
𝛼0 > 0, 𝛼1 , 𝛽1 ≥ 0, 0 < 𝛼1 + 𝛽1 < 1
Donde:
𝜀𝑡−1 𝜀𝑡−1 2
𝑙𝑛𝜎𝑡2 = 𝛿𝑜 + 𝛿1 +𝛾 + 𝜃1 𝑙𝑛𝜎𝑡−1
𝜎𝑡−1 𝜎𝑡−1
De donde,
2
𝜀𝑡−1 𝜀𝑡−1
𝜎𝑡2 = (𝜎𝑡−1 )𝜃1 𝑒𝑥𝑝 𝛿𝑜 + 𝛿1 +𝛾
𝜎𝑡−1 𝜎𝑡−1
Varianza condicional de los errores bajo el proceso EGARCH (1,1)
𝜀𝑡−1 2
𝑙𝑛𝜎𝑡2 = 𝛿0 + 𝛾 − 𝛿1 + 𝜃1 𝑙𝑛𝜎𝑡−1
𝜎𝑡−1
La varianza incondicional (o de largo plazo) de los errores bajo una estructura EGARCH (1,1) es,
𝛿0
𝜎𝜀2 = 𝑒𝑥𝑝
1 − 𝜃1
Finalmente comparando los modelos GARCH y EGARCH se puede decir que un modelo GARCH tiene
la limitación de que trata los efectos de modo simétrico, debido que utiliza los cuadrados de las
innovaciones. Otra importante limitación son las restricciones que deben cumplir los parámetros,
dichas restricciones eliminan el comportamiento al azar-oscilatorio que pueda presentar la varianza
condicional. En un modelo EGARCH no hay restricciones en los parámetros.
Causalidad: Correlación Cruzada
Propiedades:
a. 𝜌𝑥𝑦 𝑘 ≤ 1;
b. En general 𝜌𝑥𝑦 𝑘 ≠ 𝜌𝑦𝑥 −𝑘 no es simétrica alrededor del origen. Para 𝑘 > 0 mide la
relación desde 𝑥 hacia 𝑦, mientras que para 𝑘 < 0 la relación desde 𝑦 hacia 𝑥.
Causalidad: Correlación Cruzada
Propuesto por Pierce y Haugh, utiliza la técnica de preblanqueo para eliminar cualquier
patrón de autocorrelación existente en los datos.
Este procedimiento consiste en identificar y estimar el modelo ARIMA que mejor se ajuste a
cada serie y obtener los correspondientes residuos ruido blanco; estos constituyen la serie
preblanqueada.
Finalmente, se estima la correlación cruzada entre las series preblanqueadas y se
determinan las relaciones de causalidad entre cada par de series.
𝐸 𝑢𝑡 𝑣𝑡+𝑘 𝑐𝑢ෝ𝑣ො 𝑘
𝜌𝑢𝑣 𝑘 = 𝑟𝑢ෝ𝑣ො 𝑘 =
𝐸 𝑢𝑡2 𝐸 𝑣𝑡2 𝑐𝑢ෝ 0 𝑐𝑣ො 0
𝑛−𝑘
La hipótesis nula de los test, Ho: que no exista dicha causalidad. En este sentido podemos
decir que la causalidad en el sentido de Granger es una condición necesaria pero no
suficiente para la existencia de verdadera causalidad.
Causalidad de Granger
1. Si las variables son estacionarias o, siendo no estacionarias, están cointegradas, se puede correr el
siguiente modelo con las variables en estado:
𝑚 𝑛
𝑥𝑡 = 𝛼 + 𝛽𝑖 𝑥𝑡−𝑖 + 𝛾𝑗 𝑦𝑡−𝑗 + 𝑢𝑡
𝑖=1 𝑗=1
Estadístico:
𝑞 𝑟 𝐿 𝑚1
𝑦𝑡 = 𝑎 + 𝑏𝑖 𝑦𝑡−𝑖 + 𝑐𝑗 𝑥𝑡−𝑗 + 𝑣𝑡 𝐿𝑅 = −2 ln
𝐿 𝑚2
𝑖=1 𝑗=1 = 2 𝐿𝑙(𝑚1) − 𝐿𝑙(𝑚2) ~𝑋𝑛2 ó 𝑟
Se comparan frente a:
Donde 𝐿 𝑚1 y 𝐿 𝑚2 es la verosimilitud
𝑚
del modelo restringido y no restringido,
𝑥𝑡 = 𝛼 + 𝛽𝑖 𝑥𝑡−𝑖 + 𝑢𝑡 respectivamente, y 𝐿𝑙 𝑚1 y 𝐿𝑙 𝑚2 es el
𝑖=1 logaritmo de la verosimilitud.
𝑞
Las dos variables se encuentran cointegradas si los residuos del modelo anterior se
comportan como un proceso estacionario.
Causalidad de Granger
Una dificultad inherente a cualquiera de las dos versiones es determinar el número de rezagos a incluir
en los modelos, una alternativa es utilizar Akaike Información Criterion (AIC) o Criterios de información
Bayesiana (BIC) que son dos medidas usuales que comparan el ajuste (medido como verosimilitud o en
función de estadísticos de error) de distintos modelos.
AIC: Es un criterio de selección de modelos propuesto por Akaike (1974), que se basa en la teoría de
información; es útil para evaluar el desempeño de la predicción dentro y fuera de la muestra. Su
𝑆𝐶𝐸 𝐾
expresión es: ln( ) + 2 , donde 𝑆𝐶𝐸 es la suma de cuadrados del error, T el tamaño muestral y k el
𝑇−𝐾 𝑇
número de regresores usados en el modelo.
BIC: Es un criterio alternativo de selección de modelos propuesto por Schwarz (1978) con un enfoque
𝑆𝐶𝐸 𝐾
Bayesiano. Su expresión es ln 𝑇−𝐾 + 𝑇 ln 𝑇 .
Causalidad de Granger
Si No
Popularizado en 1980 por Sims como una generalización de los modelo Autorregresivos
univariados AR(p).
𝑦𝑡 = 𝑉 + 𝐴𝑦𝑡−1 + 𝑢𝑡
Modelos VAR (Vectores Autorregresivos)
Una forma de definir la longitud de rezago es a través de los criterios de información, identificar el
rezago en el que los criterios se hagan mínimos. (AIC, BIC, HQ, …). Otra forma, es con conocimiento
a priori sobre la teoría económica de las variables objeto de estudio.
Es necesario validar la estabilidad del modelo a través del análisis de los módulos de los inversos de
las raíces del polinomio conjunto de rezago asociado, los cuales deben ser menores que uno. Si el
VAR es no estable varios de los resultados serán no validos. Ej.
Modelos VAR (Vectores Autorregresivos)
Se debe verificar que los residuos tengan un comportamiento Ruido Blanco. Para
verificar el comportamiento Ruido Blanco de los residuos se utiliza la prueba Portmanteu,
un test conjunto multivariado Q-statistics de Ljung-Box hasta un especifico orden.
La hipótesis nula es que las variables son multi-ruido blanco. No autocorrelación residual
hasta un rezago determinado.
• Funciones impulso respuesta. Esta función permite determinar ante choques, por lo
general de una desviación estándar, en una determinada variable (X o Y o Z), como se
afectan las demás variables. Un choque a la i-esima variable no solo afecta la i-esima
variable sino que el efecto es transmitido a todas las otras variables a través de la
estructura dinámica o de rezago del modelo VAR. Es importante resaltar que para lograr
la identificación de los choques sobre las variables es necesario llevar a cabo una
transformación sobre el vector de errores o innovaciones del VAR a una forma ortogonal.
¿Qué sucede cuando quiero estimar un modelo donde las variables son no estacionarias? La solución
consiste en la búsqueda de una o más combinaciones lineales de dichas variables que sean estacionarias, y
que, a su vez minimicen la varianza de la representación VAR estacionaria.
𝑍𝑡 = 𝛽 ′ 𝑌𝑡
𝑝
∆𝑌𝑡 = 𝛼𝛽 ′ 𝑌𝑡−1 + σ𝑖=1 𝜏𝑖 ∆𝑌𝑡−𝑖 + 𝜀𝑖
El vector α, contiene los coeficientes de velocidad de ajuste, multiplica el desequilibrio que encuentra en el
corto plazo entre las variables del sistema, y lo transmite a cada una de ellas, de tal manera que los
cambios en las variables para el siguiente período dependan de su desequilibrio en el período anterior.
Modelos VEC (Vectores Autorregresivos)
X,Y
Si No
El VEC se debe utilizar cuando las
variables están integradas y están
cointegradas.
Adoptar un Modelo VAR ¿Están cointegradas?
Los objetivos de la prueba: Determinar el número de vectores de cointegración entre las variables y
estimar el sistema conformado por dichas variables, considerando las restricciones de largo plazo (si estas
existen).
Ya sea mediante el test de la traza o del máximo valor propio, es una prueba secuencial que finaliza al no
encontrar evidencia para rechazar la hipótesis nula
Modelos VEC (Vectores Autorregresivos)
Como existen varias posibilidades en la estructura de cointegración del modelo:
Se utiliza la propuesta del criterio de Pantula, la cual permite identificar la opción menos restrictiva.
• Un modelo que trata de explicar los factores determinantes de que una familia sea propietaria de una
casa. (1 Propietario-0 no Propietario).
• Economía Laboral: Determinantes de participación laboral y de ocupación.
• Economía de la Educación: Determinantes de ir a la Universidad.
• Economía de la Innovación: Determinantes de las actividades innovadoras.
• Economía Internacional: Determinantes de la decisión de exportar.
• Economía de la Salud: Determinantes de tener hijo, determinantes de fumar.
• Geografía Económica: Analizar las decisiones sobre los medios de transporte
Realizando un Análisis de Transporte
Usted tiene dos alternativas para resolver su problema de transporte a su trabajo:
1 𝑇𝑟𝑎𝑛𝑠𝑝𝑜𝑟𝑡𝑒 𝑃𝑟𝑖𝑣𝑎𝑑𝑜
𝑌=ቊ
0 𝑇𝑟𝑎𝑛𝑠𝑝𝑜𝑟𝑡𝑒 𝑃ú𝑏𝑙𝑖𝑐𝑜
Transporte ¿en que medio de transporte se va para el trabajo?
Base de datos: Transporte (Corte Transversal)
Por lo tanto la probabilidad de que usted
seleccione un medio de transporte privado es
igual a P[Y=1]=p, y transporte público,
P[Y=0]=1-p, la función de probabilidad es
𝑓 𝑦 = 𝑝 𝑦 (1 − 𝑝)1−𝑦 , 𝑦 = 0,1
𝑦 = 𝑋𝛽 + 𝑒
• Nuestro interés no esta en el valor de Y (que puede ser 1 o 0) sino que esta en la probabilidad
que el valor sea 1 (“Response Probability”)
• La probabilidad es una función lineal de las variables exógenas
𝑃 𝑌𝑖 = 1 = 𝑋𝑖 𝛽 + 𝑒𝑖
• Análogo al modelo de regresión lineal múltiple.
• Estimación por mínimos cuadrados ordinarios.
Modelo de Probabilidad Lineal
• Se puede aplicar MCO a este problema, pero existen 3 inconvenientes:
𝑒𝑖 = 1 − 𝛼 − 𝛽𝑋𝑖 𝐶𝑢𝑎𝑛𝑑𝑜 𝑌𝑖 = 1
𝑒𝑖 = −𝛼 − 𝛽𝑋𝑖 𝐶𝑢𝑎𝑛𝑑𝑜 𝑌𝑖 = 0
En consecuencia los errores no se distribuyen como una normal (de hecho lo hacen como una
binomial)
𝑉𝑎𝑟 𝑒 𝑋 = 𝑥′𝛽(1 − 𝑥 ′ 𝛽)
Modelo de Probabilidad Lineal
• Estimación
Valores fuera de Rango
X para los cuales P(Y=1) nos da valores fuera del rango (0,1)
0.5
0
-3 -2 -1 0 1 2 3
Modelos No Lineales-Logit y Probit
Se asume existencia de una variable latente (Y*)
• Y* determina el valor de y
1 → 𝑦𝑖∗ = 𝑋𝑖 𝛽 + 𝑣𝑖 > 0
𝑦𝑖 = ቊ
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
• Entonces vamos a observar Y=1 solo cuando
𝑣𝑖 > −𝑋𝑖 𝛽
• Consecuentemente
𝑃 𝑦𝑖 = 1 = 𝑃 𝑣𝑖 > −𝑋𝑖 𝛽 = 1 − F(−𝑋𝑖 𝛽)
• Siendo F la función de densidad acumulada de la variable aleatoria 𝑣𝑖 y entonces la probabilidad que
y=0 es:
𝑃 𝑦𝑖 = 0 = 𝐹(−𝑋𝑖 𝛽)
• La forma de F dependerá desde la distribución de 𝑣𝑖
–Si 𝑣𝑖 se distribuye como una función normal
–Si 𝑣𝑖 se distribuye como una función logística
Ajuste no Lineal
Modelo Probit
𝛼+𝛽𝑋𝑖 𝑆2
1 −
𝑌𝑖 = න 𝑒 2 𝑑𝑠 + 𝑢𝑖
−𝛼 2𝜋
Modelo Logit
1 𝑒 𝛼+𝛽𝑋𝑖
𝑌𝑖 = + 𝑢𝑖 = + 𝑢𝑖
1 + 𝑒 −𝛼−𝛽𝑋𝑖 1 + 𝑒 𝛼+𝛽𝑋𝑖
Selección del Modelo
1. Elección de variables de acuerdo a la significancia
2. Prueba de significancia global
3. No existe mucha diferencia entre Logit y Probit
– Ajuste de probabilidades bajas
Función de Densidad Función de Distribución Acumulada
Distribución Normal Normal Estándar
1
0
𝜇 𝑋 -3 0 3 𝑍
−𝑋𝑖 𝛽
𝑃 𝑣𝑖 < −𝑋𝑖 𝛽 = F −𝑋𝑖 𝛽 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑃 𝑣𝑖 > −𝑋𝑖 𝛽 = 1 − F(−𝑋𝑖 𝛽)
¿Cómo vamos a encontrar los parámetros beta?
Se utiliza la técnica de máxima verosimilitud donde 𝑃 𝑌𝑖 = 1 − F −𝑋𝑖 𝛽 si 𝑌𝑖 =1 o 𝑃 𝑌𝑖 = F −𝑋𝑖 𝛽 si
𝑌𝑖 =0.
REAL
Y=1 Y=0
Predichos
PRONÓSTICO
• El impacto de las variables independientes (impacto marginal) es diferente dependiendo del punto en
el cual se calcula el impacto.
𝑑𝐹(𝑋𝑖 𝛽 )
= 𝑓(𝑋𝑖 𝛽)𝛽𝑘
𝑑𝑥𝑖𝑘
• Entonces recordando la distribución normal es claro que el impacto marginal varia dependiendo en
donde se encuentre el umbral 𝑋𝑖 𝛽.
• Puntos cercanos a la media tienen un impacto mucho mayor en comparación con puntos en las “colas”
de la distribución
Evaluación del Modelo
• Una forma intuitiva de hacerlo es medir la capacidad de nuestro modelo de “atinar” la realidad.
–Si 𝑌𝑖 = 1 y nuestro modelo predice que P(𝑌𝑖 ) F(𝑋𝑖 𝛽)>0.5 entonces esta bien.
–La “Frecuencia” con que “Atinamos” es un indicador de bondad de ajuste.
• Otra forma de evaluar el modelo es usar el Pseudo R2 que compara la función de verosimilitud así
como maximizada por los betas estimados con una función donde todos los betas son cero (y solo hay
una constante)
𝑛 𝑛
𝐷 = −2 𝐿𝑜𝑔 𝑝Ƹ 𝑖 + 𝐿𝑜𝑔 1 − 𝑝Ƹ 𝑖
𝑦𝑖 =1 𝑦𝑖 =0
𝐷𝑒𝑣𝑖𝑎𝑛𝑧𝑎
𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2 = 1 −
𝐷𝑒𝑣𝑖𝑎𝑛𝑧𝑎 𝑅𝑒𝑠𝑡𝑟𝑖𝑛𝑔𝑖𝑑𝑎
𝐷 2 𝐾+1
𝐴𝐼𝐶 = +
𝑛 𝑛
𝑔
(𝑂𝑖 − 𝑛′𝑖 𝑝ҧ𝑖 )2
𝐶= ′
𝑛 𝑖 𝑝𝑖ҧ (1 − 𝑝ҧ𝑖 )
𝑖=1
Siendo PI, Probabilidad de Incumplimiento, PDI es la Pérdida Dado el Incumplimiento, también conocida
como Severidad (% del monto que perdería la entidad) y EDI es la Exposición Dado el Incumplimiento,
que es simplemente el monto de los activos expuestos (saldo de cuenta).
𝑝
𝐿𝑛 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑛 𝑋𝑛
1−𝑝
1 𝑒𝑧
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝐸𝑣𝑒𝑛𝑡𝑜 = =
1 + 𝑒 −(𝛽0+𝛽1𝑋1+𝛽2𝑋2+⋯+𝛽𝑛𝑋𝑛) 1 + 𝑒𝑧
Después de la Estimación
El Scoring:
–Si se tiene un Score Bajo se le pone tasas de interés alta, se vende la cartera, se titulariza,
se les presta menor cantidad, se colocan más garantías, altas políticas de cobranza.
Miguel Angel Bello
Economista, MBA, CRM.
miguel.bello@software-shop.com