Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
RESUMEN
En este artículo se compara el desempeño de un modelo ARIMA, un perceptron
multicapa y una red neuronal autorregresiva para pronosticar la demanda
mensual de electricidad en Colombia para el siguiente mes adelante. Los
datos disponibles fueron divididos en dos conjuntos, el primero para estimar
los parámetros del modelo y el segundo para la capacidad de predicción por
fuera de la muestra de calibración. Los resultados revelan que la red neuronal
autorregresiva es capaz de pronosticar la demanda con mayor precisión que
los otros dos modelos cuando la totalidad de los datos es considerada.
PALABRAS CLAVE
Demanda, pronóstico, redes neuronales, ARIMA.
Clasificación JEL: C450, C530
* Es producto de la investigación realizada por los grupos de Mercados de Energía y Computación Aplicada
en el modelado y la predicción de variables económicas en mercados de electricidad. Patrocinado por la
Facultad de Minas, Universidad Nacional de Colombia.
** Autor para correspondencia
KEYWORDS PALAVRAS-CHAVE
Demand, forecast, neural networks, Procura, previsão, redes neurais,
ARIMA. ARIMA.
38 ESTUDIOS
GERENCIALES Vol. 25 No. 112 • Julio - Septiembre de 2009
INTRODUCCIÓN muchos esfuerzos para comprender
La demanda de electricidad, junto con mejor cómo evoluciona la demanda,
la oferta y la regulación, conforman qué factores influyen en su com-
las tres fuerzas fundamentales que portamiento y en qué forma y qué
gobiernan la evolución de los mercados modelos podrían ser más adecuados
de electricidad. Es bien sabido que el para estudiar su evolución histórica y
comportamiento de la demanda es para realizar predicciones. Entre los
el fruto de la interacción de un gran modelos más usados se encuentran:
número de factores complejos que regresión multivariada, cointegración
son propios de los mercados eléctricos (Beenstock, Goldin y Nabot, 1999;
(Franco, Velásquez y Olaya, 2008). Nasr, Badr y Joun, 2003), funciones
La demanda es uno de los factores de transferencia (Harris y Liu, 1993;
determinantes de los precios de la Tserkezos, 1992) y modelos ARIMA
electricidad en los mercados eléctricos (Barrientos, Olaya y González, 2007;
liberalizados, junto con las complejida- Castaño, 2008; Murillo, Trejos y
des y el comportamiento del sistema Carvajal, 2003); estos estudios han
de generación de electricidad y las demostrado que, en general, la de-
reglas de mercado impuestas por la re- manda depende principalmente de la
gulación. La evolución de la demanda temperatura (Abdel-Aal, Al-Garni y
está estrechamente relacionada con Al-Nassar, 1997; Harris y Liu, 1993;
la evolución de los diferentes sectores Mirasgedis, Sarafidis, Georgopoulou,
económicos de la sociedad, los avances Lalas, Moschovits, Karagiannis y
tecnológicos encaminados al uso más Papakonstantinou, 2006; Tserkezos,
eficiente y racional de la energía y la 1992), el tamaño de la población (Al-
estacionalidad del clima que puede Saba y El-Amin, 1999; Egelioglu,
variar los comportamientos típicos de Mohamad y Guven, 2001), el creci-
estación a estación. miento económico (ingreso per cápita
o el producto interno bruto) (Medina
La predicción de la demanda es un in- y García, 2005; Nasr, Badr y Dibeh,
sumo fundamental para los procesos 2000; Tserkezos, 1992) y el precio de
decisorios operativos y estratégicos la electricidad (Abdel-Aal y Al-Garni,
que realizan los agentes del merca- 1997; Medina y García, 2005).
do, pero resulta ser una tarea difícil
debido a la cantidad y complejidad de La predicción es hecha para dife-
los factores que influyen en su com- rentes escalas de tiempo según las
portamiento. Desde un punto de vista necesidades particulares del agente;
institucional, la predicción de corto así, la predicción ha sido realizada
plazo es utilizada para planificar la para datos anuales (Ediger y Tatlidil,
operación del sistema, mientras que 2002; Egelioglu et al., 2001; Moha-
la predicción de largo plazo es usada med y Bodger, 2005), trimestrales
habitualmente como un insumo en las (Beenstock et al., 1999; Tserkezos,
decisiones de expansión en capacidad 1992), mensuales (Abdel-Aal et al.,
de generación y del sistema de distri- 1997; Benavente, Galetovic, Sanhue-
bución (Al-Saba y El-Amin, 1999). za y Serra, 2005; Chaveza, Bernata
y Coallab, 1999; Harris y Liu, 1993;
Dada su importancia, no es sor- Medina y García, 2005; Mirasgedis et
prendente que se hayan dedicado al., 2006; Saab, Badr y Nasr, 2001),
40 ESTUDIOS
GERENCIALES Vol. 25 No. 112 • Julio - Septiembre de 2009
reviste el problema de tener que co- (ARNN, por sus siglas en inglés) para
nocer el valor futuro de las variables pronosticar la demanda mensual
explicativas para poder efectuar la de electricidad en Colombia usando
predicción de la demanda. únicamente datos de la demanda de
los meses pasados.
Barrientos et al. (2007) realizaron la
predicción de la demanda a escalas La originalidad, relevancia e impor-
horaria, diaria y mensual para la tancia de la investigación propuesta
región suroccidental del país, usando está basada en los siguientes aspec-
funciones spline y modelos ARIMA. tos:
En este trabajo se desarrolló un
• Los agentes del mercado eléctrico
modelo para cada hora del día para
colombiano tienen la clara nece-
el periodo comprendido entre 2001:1
sidad de obtener pronósticos de
y 2001:12. Igualmente, Murillo et al.
la demanda futura del sistema,
(2003) construyeron un modelo de la
que es utilizada para la toma de
demanda de una empresa colombiana
decisiones tanto operativas como
en el año 2001 usando la metodología
estratégicas. Ya que los modelos
ARIMA. Castaño (2008) desarrolló un
empleados para la preparación de
modelo ARIMA con intervenciones,
las proyecciones oficiales no están
el cual fue usado para representar la
disponibles al público, es necesario
dinámica de la demanda de la hora
que se desarrollen modelos que
12 en el periodo comprendido entre
permitan cumplir esta labor.
1996:1 y 2002:8. Finalmente, Franco
et al. (2008) modelaron la demanda • Distintos estudios han señalado
mensual de electricidad para el perio- que las series de demanda poseen
do comprendido entre 1995:8 y 2006:1 comportamientos no lineales. Esta
usando un modelo de componentes no conclusión no puede tomarse como
observables; la aproximación emplea- una verdad absoluta y es necesa-
da por Franco et al. permitió separar rio constatar de forma empírica
la componente estacionaria asociada que efectivamente un modelo no
al ciclo anual de la tendencia de largo lineal sería más preciso que uno
plazo; los autores concluyeron que la lineal (ARIMA, en el caso de este
componente periódica posee un com- artículo) a la hora de hacer pre-
portamiento estocástico de amplitud dicciones. Esta es la razón para
constante y que su tendencia revela que se incluya el modelo ARIMA
una componente determinística lineal dentro de la comparación
de crecimiento aproximadamente • Existe una amplia variedad de
constante durante los últimos años, modelos no lineales que podrían
cuyas fases de crecimiento y decre- servir para la predicción de la se-
cimiento coinciden con los ciclos del rie usada en esta investigación. La
producto interno bruto. estimación de cada uno de ellos, o
El objetivo principal de este artículo al menos de un grupo representa-
es comparar la capacidad de un mo- tivo, es necesaria cuando se desea
delo ARIMA, un perceptron multi- encontrar el mejor modelo de pro-
capa (MLP, por sus siglas en inglés) nóstico. Sin embargo, este alcance
y una red neuronal autorregresiva va más allá de los recursos dispo-
1 Neón es un servicio de información gratuito que permite la consulta interactiva de las principales variables
relacionadas con la evolución del mercado eléctrico colombiano; este servicio es prestado por XM Compañía
de Expertos en Mercados S. A. ESP, a través de su página WEB (www.xm.com.co)
42 ESTUDIOS
GERENCIALES Vol. 25 No. 112 • Julio - Septiembre de 2009
lan la efectividad de los modelos de conexión de la neurona de entrada p
redes neuronales para el pronóstico hacia la neurona oculta h, G (.) es la
de series de tiempo, entre los que se función de activación de las neuronas
incluyen Conejo, Contreras, Espínola de la capa oculta, H es el número de
y Plazas (2005), Ghiassi, Saidane neuronas en la capa oculta, y es la
y Zimbra (2005), Heravi, Osborn y desviación estándar de yt y su uso
Birchenhall (2004), Swanson y White evita tener que transformar y para
(1997a, 1997b) y Teräsvirta, Van Dijk restringir sus valores al rango de la
y Medeiros (2005). función G (.).
En este trabajo se emplea un modelo La función de activación de las
conocido como red neuronal autorre- neuronas de la capa oculta G(u) se
gresiva (ARNN), cuyo uso ha sido define como en la ecuación 2, la cual
poco difundido, y el cual está com- se conoce como función sigmoidea
puesto por un modelo lineal autorre- bipolar. En la literatura más rele-
gresivo más un perceptron multicapa vante se ha sugerido que funciones
con una única capa oculta (Lee, White simétricas alrededor del origen, tal
y Granger, 1993; Teräsvirta, Lin y como (2), convergen más rápida-
Granger, 1993; White, 1989). En un mente que la función sigmoidea tra-
modelo ARNN, la variable dependien- dicional. Adicionalmente, la adición
te yt (que en este caso corresponde a la del término lineal 0,025u ayuda a
demanda) es obtenida después como la convergencia, ya que se evita la
una función no lineal de sus valores saturación de la neurona o unidad
pasados yt-p como en la Ecuación 1; de procesamiento en la capa oculta
en donde ei son los residuales del y garantiza un gradiente mínimo
modelo y para los cuales ei = et , es cuando la salida neta de la función
la desviación estándar de los errores, de activación sea cercana a sus
et es una variable aleatoria que sigue valores extremos. Esto beneficia el
una distribución normal estándar, proceso de optimización numérica,
es un término constante que repre- ya que evita que el algoritmo caiga
senta el peso de la conexión entre en regiones planas donde el gradien-
una neurona adaptativa y la neurona te es prácticamente cero.
de salida, p son los coeficientes de la
Los parámetros del modelo
componente autorregresiva del mode-
lo, h son los parámetros asociados a �
� � � � , � h , � p , �h , p ,h �,
las conexiones de la capa oculta hacia
la neurona de salida, h son los pa- para h= 1,..., H y p=1,...,P; son obte-
rámetros asociados a las conexiones nidos minimizando la sumatoria del
de la neurona adaptativa hacia las error cuadrático medio (SSE) calcu-
neuronas de la capa oculta, αp,h es la lado sobre la muestra de calibración
P H � 1 � P ��
yt � � * � � � p yt � p � � � h � G� � � h � � � p , h � y t � p � � � et
� ��
(1)
� 2�
p �1 h �1 � y � p �1 ��
2
G (u ) � � 1 � 0,025u (2)
1 � exp(�u )
44 ESTUDIOS
GERENCIALES Vol. 25 No. 112 • Julio - Septiembre de 2009
24 (entre 2006:7 y 2008:6) meses, sutiles y que son difícilmente identifi-
respectivamente. cables en los datos. Zhang y Qi (2005)
presentan evidencia empírica para
Debido a que la serie estudiada
indicar que la sugerencia de Masters
presenta una clara componente de
(1993) permite obtener predicciones
tendencia y un ciclo de periodicidad
más precisas. No obstante, la pregunta
anual (Franco et al., 2008), se aplicó
de cómo deben tratarse la tendencia y
una diferenciación simple y una dife-
el ciclo estacional cuando se pronostica
renciación estacional de periodo 12 al
con modelos no lineales sigue abierta,
logaritmo de la demanda de electri-
ya que las soluciones planteadas en
cidad. De esta forma, los parámetros
la literatura no son completamente
de los modelos y los estadísticos de
satisfactorias.
ajuste fueron obtenidos para la serie
wt que fue obtenida como: El número máximo de rezagos fue
obtenido como el mínimo orden P de
wt � (1 � B )(1 � B12 ) log( d t ) (4)
un modelo autorregresivo, AR(P),
Donde dt es la serie de demanda men- tal que las autocorrelaciones de los
sual en miles de GWh, B es el opera- residuales obtenidos al modelar la
dor de diferenciación, por definición serie wt con dicho modelo no fueran
Byt = yt-1; en consecuencia, B12yt = yt-12 significativamente diferentes de cero.
(Box y Jenkins, 1976). Se encontró que P debería ser 24. Este
La popularización de los operadores es un criterio puramente heurístico
de diferenciación utilizados es debida con el cual se busca establecer el
a que son una parte fundamental de rezago más lejano que debería ser
la estrategia de especificación de los tenido en cuenta en la búsqueda del
modelos SARIMA (Box y Jenkins, mejor modelo de predicción. En esta
1976), para los cuales se exige que la investigación se consideró que todos
serie modelada sea estacionaria. Su los modelos tenían como entradas los
fundamento teórico está basado en valores rezagos de la serie desde 1
los conceptos de procesos con raíces hasta p para p=1,…, P; nótese que no
unitarias y raíces estacionales. Estos se consideraron todos los subconjun-
conceptos se derivan de la condición tos de rezagos que pueden obtenerse
de linealidad de la serie y no existen (224-1≈16,7 millones de combinacio-
equivalentes teóricos para el caso de nes), ya que resulta inviable compu-
los modelos no lineales, tales como las tacionalmente.
redes neuronales; consecuentemente, La bondad del ajuste de los mode-
su aplicación no está justificada desde los a las muestras de calibración y
la teoría. predicción fue medida mediante la
No obstante, Masters (1993) recomien- sumatoria del error cuadrático medio
da el uso de los operadores de diferen- (SSE, por sus siglas en inglés) de los
ciación en la predicción de redes neuro- residuales, et, ya definido en (4) y su
nales ya que se eliminan características desviación media absoluta (MAD, por
fácilmente identificables de la serie (la sus siglas en inglés):
tendencia y el patrón estacional) y así, 1 R
la red neuronal artificial puede con- MAD � � | et |
R t �1
(5)
centrarse en aprender relaciones más
46 ESTUDIOS
GERENCIALES Vol. 25 No. 112 • Julio - Septiembre de 2009
En segunda instancia, se estimaron modelos obtenidos para cada grupo
varios MLP cuyas entradas corres- de rezagos y sus correspondientes
ponden a la serie wt rezagada desde estadísticos de ajuste son presenta-
1 hasta P meses y con H neuronas en dos en la Tabla 2. El modelo MLP-19
la capa oculta, para H = 1,…, 4. Para presenta los mejores resultados de
cada grupo de MLP con rezagos des- ajuste a la muestra de calibración
de 1 hasta P y diferente número de (entrenamiento) con una SSE de
neuronas en la capa oculta, se selec- 0,0181, seguido por el modelo MLP-23
cionó el modelo con mejores estadís- con una SSE de 0,0191 (es decir, se
ticos globales de ajuste. Los mejores da un incremento del 5%).
48 ESTUDIOS
GERENCIALES Vol. 25 No. 112 • Julio - Septiembre de 2009
MA-24 y MLP-23) la ARNN presenta presente el mejor ajuste a la totalidad
las magnitudes más altas en los SSE de los datos.
para los horizontes de pronóstico de
En el Gráfico 1 se presenta el logarit-
12 y 24 meses, que corresponden a
mo de la demanda y la predicción para
incrementos, de al menos, el 117% y
el mejor modelo de cada tipo. La línea
17% de los obtenidos por los modelos
gris corresponde a los datos históricos
ARIMA-24 y MLP-23. No obstante,
y la línea negra a la predicción obteni-
estos incrementos en los errores de
da con cada modelo. Los datos para el
predicción son compensados por el
gráfico fueron obtenidos realizando la
ajuste a la muestra de calibración,
transformación inversa de los proce-
causando que el modelo ARNN-24
Entrenamiento
Modelo Rezagos H Predicción SSE (MAD)
SSE (MAD)
1 año 2 años
8.4
log (DEMANDA)
8.3
8.2
8.1
8
1/1996 1/1997 1/1998 1/1999 1/2000 1/2001 1/2002 1/2003 1/2004 1/2005 1/2006 1/2007 1/2008
mes/año
(b) MLP
8.5
8.4
log (DEMANDA)
8.3
8.2
8.1
8
1/1996 1/1997 1/1998 1/1999 1/2000 1/2001 1/2002 1/2003 1/2004 1/2005 1/2006 1/2007 1/2008
mes/año
(C) ARNN
8.5
8.4
log (DEMANDA)
8.3
8.2
8.1
8
1/1996 1/1997 1/1998 1/1999 1/2000 1/2001 1/2002 1/2003 1/2004 1/2005 1/2006 1/2007 1/2008
mes/año
50 ESTUDIOS
GERENCIALES Vol. 25 No. 112 • Julio - Septiembre de 2009
Gráfico 2. Residuos de la predicción para cada uno de los modelos seleccio-
nados
(a) ARMA
0.08
0.06
0.04
0.02
0
-0.02
-0.04
-0.06
1/1996 1/1997 1/1998 1/1999 1/2000 1/2001 1/2002 1/2003 1/2004 1/2005 1/2006 1/2007 1/2008
mes/año
(b) MLP
0.08
0.06
0.04
0.02
0
-0.02
-0.04
-0.06
1/1996 1/1997 1/1998 1/1999 1/2000 1/2001 1/2002 1/2003 1/2004 1/2005 1/2006 1/2007 1/2008
mes/año
(C) ARNN
0.08
0.06
0.04
0.02
0
-0.02
-0.04
-0.06
1/1996 1/1997 1/1998 1/1999 1/2000 1/2001 1/2002 1/2003 1/2004 1/2005 1/2006 1/2007 1/2008
mes/año
52 ESTUDIOS
GERENCIALES Vol. 25 No. 112 • Julio - Septiembre de 2009
13. Ediger, V. y Tatlidil, H. (2002). forward networks are universal
Forecasting the primary energy approximators. Neural Networks,
demand in turkey and analysis 2, 359–366.
of cyclic patterns. Energy Con-
22. Kaastra, I. y Boyd, M. (1996).
version and Management, 43(4),
Designing a neural network for
473–487.
forecasting financial and economic
14. Egelioglu, F., Mohamad, A. y Gu- series. Neurocomputing, 10, 215–
ven, H. (2001). Economic variables 236.
and electricity consumption in
23. Lee, T.H., White, H. y Granger,
northern Cyprus. Energy, 26(4),
C.W.J. (1993). Testing for ne-
355–362.
glected nonlinearity in time series
15. Franco, C.J., Velásquez, J.D. y Ola- models. Journal of Econometrics,
ya, Y. (2008). Caracterización de la 56, 269-290.
demanda mensual de electricidad
24. Masters, T. (1993). Practical Neu-
en Colombia usando un modelo
ral Network Recipes in C++ (1ra.
de componentes no observables.
ed.). San Diego, CA: Academic
Cuadernos de Administración, 21,
Press Professional.
36, 221-235
25. Masters, T. (1995). Neural, Novel
16. Funahashi, K. (1989). On the ap-
and Hybrid Algorithms for Time
proximate realization of continu-
Series Prediction (1ra ed.). New
ous mappings by neural networks.
York, NY: John Wiley and Sons.
Neural Neworks, 2, 183–192.
26. Medina, S. y García, J. (2005). Pre-
17. Ghiassi, M., Saidane, H. y Zimbra,
dicción de demanda de energía en
D.K. (2005). A dynamic artificial
Colombia mediante un sistema de
neural network model for forecast-
inferencia difuso neuronal. Revista
ing time series events. Interna-
Energética, 33, 15–24.
tional Journal of Forecasting, 21,
341-362. 27. Mirasgedis, S., Sarafidis, Y.,
Georgopoulou, E., Lalas, D., Mos-
18. Harris, J. y Liu, L.M. (1993).
chovits, M., Karagiannis, F. y
Dynamic structural analysis and
Papakonstantinou, D. (2006).
forecasting of residential electric-
Models for mid-term electricity
ity consumption. International
demand forecasting incorporat-
Journal of Forecasting, 9(4), 437–
ing weather influences. Energy,
455.
31(2–3), 208–227.
19. Harvey, A. (1989). Forecasting,
28. Mohamed, Z. y Bodger, P. (2005).
structural time series models and
Forecasting electricity consump-
the Kalman filter. Cambridge, MA:
tion in New Zealand using eco-
Cambridge University Press.
nomic and demographic variables.
20. Heravi, C., Osborn, D.R. y Birch- Energy, 30(10), 1833–1843.
enhall, C.R. (2004). Linear versus
29. Murillo, J., Trejos, A. y Carvajal,
neural network forecasts for Euro-
P. (2003). Estudio del pronóstico
pean industrial production series.
de la demanda de energía eléctrica
International Journal of Forecast-
utilizando modelos de series de
ing, 20(3), 435-446.
tiempo. Scientia et Technica, 23,
21. Hornik, K., Stinchcombe, M. y 37–42.
White, H. (1989). Multilayer feed-
30. Murray, F. y Ringwood, J. (1994).
54 ESTUDIOS
GERENCIALES Vol. 25 No. 112 • Julio - Septiembre de 2009