Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Series temporales
AULA POLITCNICA / ETSEIT
Series temporales
Montserrat Pepi Vials
Primera edicin: septiembre 2001
Diseo de la cubierta: Manuel Andreu
Montserrat Pepi Vials, 2001
Edicions UPC, 2001
Edicions de la Universitat Politcnica de Catalunya, SL
Jordi Girona Salgado 31, 08034 Barcelona
Tel.: 934 016 883 Fax: 934 015 885
Edicions Virtuals: www.edicionsupc.es
E-mail: edicions-upc@upc.es
Produccin: Barcelona Digital, SL
Rossell 77, 08029 Barcelona
Depsito legal: B-29.192-2001
ISBN: 84-8301-526-9
Quedan rigurosamente prohibidas, sin la autorizacin escrita de los titulares del copyright, bajo las san-
ciones establecidas en las leyes, la reproduccin total o parcial de esta obra por cualquier medio o pro-
cedimiento, comprendidos la reprografa y el tratamiento informtico, y la distribucin de ejemplares de
ella mediante alquiler o prstamo pblicos.
ndice p9
NDICE
TEORA DE SERIES TEMPORALES
1 Introduccin
2 Anlisis de una serie temporal
2.1 Modelizacin por componentes ..............................................................................14
2.2 Enfoque Box Jenkins ...........................................................................................19
3 Descomposicin de una serie temporal
3.1 Medias mviles: tendencia......................................................................................24
3.2 Estacionalidad ........................................................................................................27
3.3 Caso temperaturas .................................................................................................31
3.4 Caso usuarios transporte pblico............................................................................37
4 Modelizacin con variables categricas
4.1 Comparacin del mtodo de descomposicin con el de variables categricas .......48
4.2 Caso usuarios de un telfono .................................................................................52
5 Autocorrelacin
5.1 Correlograma..........................................................................................................58
5.2 Interpretacin de los correlogramas........................................................................63
6 Otras tcnicas de previsin: ponderacin exponencial
6.1 Suavizado exponencial ...........................................................................................65
6.2 Seleccin del factor de ponderacin.......................................................................67
6.3 Mtodo de Brown ...................................................................................................72
7 Otros ejemplos
7.1 Ventas de papel......................................................................................................77
7.2 Generacin de electricidad .....................................................................................81
p10 Series temporales
PRCTICAS DE SERIES TEMPORALES CON EXCEL
Prctica1. Descomposicin clsica de una serie aditiva
1.1 Recuperacin de los datos .....................................................................................89
1.2 Anlisis de la evolucin de la serie cronolgica ......................................................90
1.3 Estabilizacin de la serie ........................................................................................94
1.4 Estacionalidad ........................................................................................................96
1.5 Estimacin de la tendencia...................................................................................100
1.6 Modelo y residuos ................................................................................................103
1.7 Previsiones...........................................................................................................105
1.8 Resultados ...........................................................................................................107
Prctica 2. Autocorrelacin y correlograma
2.1 Recuperacin de los datos ...................................................................................115
2.2 Clculo de los coeficientes de autocorrelacin .....................................................115
2.3 Autocorrelograma.................................................................................................118
2.4 Resultados ...........................................................................................................120
Prctica 3. Modelizacin de una serie con variables categricas
3.1 Recuperacin de los datos ...................................................................................122
3.2 Anlisis de la evolucin de la serie cronolgica ....................................................123
3.3 Modelizacin con variables categricas................................................................124
3.4 Estimaciones y residuos .......................................................................................127
3.5 Previsiones...........................................................................................................128
3.6 Resultados ...........................................................................................................130
Prctica 4. Modelizacin y previsiones por suavizado exponencial (Mtodo de Brown)
4.1 Recuperacin de los datos ...................................................................................136
4.2 Anlisis de la evolucin de la serie cronolgica ....................................................137
4.3 Mtodo de Brown .................................................................................................138
4.4 Resultados ...........................................................................................................141
EVALUACIONES DE SERIES TEMPORALES
1 Evaluaciones propuestas
1.1 13.5.98 .................................................................................................................147
1.2 3.5.99 ...................................................................................................................148
1.3 23.6.99 .................................................................................................................149
1.4 12.1.00 .................................................................................................................150
1.5 17.5.00 .................................................................................................................151
2 Evaluaciones resueltas
2.1 13.5.98 .................................................................................................................153
2.2 3.5.99 ...................................................................................................................156
2.3 23.6.99 .................................................................................................................159
2.4 12.1.00 .................................................................................................................161
2.5 17.5.00 ..............................................................................................................164
Series temporales p167
BIBLIOGRAFA BSICA
n Anderson, O.D., Time Series Analysis and Forecasting, (1977).
n Ardanuy, R., Martn, Q. , Estadstica para Ingenieros, Hesprides (1993).
n Chatfield, C., The Analysis of Time Series, Chapman & Hall (1996).
n Diebold, F.X., Elementos de pronsticos, International Thomson Editores (1998).
n Makridakis, S. , Wheelwright, S., McGee, V., Forecasting: Methods and Applications,
John Wiley (1983).
n Newbold, P., Estadstica para los negocios y la economa, Prentice Hall (1997).
Introduccin p11
TEORA DE SERIES TEMPORALES
1 INTRODUCCIN
Una serie temporal es un conjunto de observaciones ordenadas en el tiempo o, tambin, la
evolucin de un fenmeno o variable a lo largo de l. Esta variable puede ser econmica
(ventas de una empresa, consumo de cierto producto, evolucin de los tipos de inters,...),
fsica (evolucin del caudal de un ro, de la temperatura de una regin, etc.) o social (nmero
de habitantes de un pas, nmero de alumnos matriculados en ciertos estudios, votos a un
partido,...).
El objetivo del anlisis de una serie temporal, de la que se dispone de datos en perodos
regulares de tiempo, es el conocimiento de su patrn de comportamiento para prever la
evolucin futura, siempre bajo el supuesto de que las condiciones no cambiarn respecto a
las actuales y pasadas.
Si al conocer la evolucin de la serie en el pasado se pudiese predecir su comportamiento
futuro sin ningn tipo de error, estaramos frente a un fenmeno determinista cuyo estudio
no tendra ningn inters especial. Esto correspondera a una situacin como la de la figura
1.1, que muestra la intensidad de corriente, I, que circula a travs de una resistencia, R,
sometida a un voltaje sinusoidal, V(t) = a cos (vt + ); por tanto I(t) = a cos (vt + )/R.
-1,5
-1
-0,5
0
0,5
1
1,5
0 20 40 60 80 t
I(t)
Fig. 1.1.- Observaciones de la serie I(t) = cos (0,5t + /2)
En general, las series de inters llevan asociados fenmenos aleatorios, de forma que el
estudio de su comportamiento pasado slo permite acercarse a la estructura o modelo
probabilstico para la prediccin del futuro. Estos modelos se denominan tambin procesos
estocsticos. As, un proceso estocstico es una sucesin de variables aleatorias {Y
t
}, con
t = 1, 2, ..., n, que evolucionan con el tiempo ( representado ste por el subndice t).
Cuando se dispone de n datos de un proceso estocstico, se est frente a n muestras, de
tamao unidad, extradas de la poblacin (variable aleatoria), correspondientes al tiempo en
que se realiz la medicin, y esto es lo que constituye la serie temporal o cronolgica.
Como ejemplo puede servir la evolucin a lo largo de un ao del ndice IBEX35, que recoge
los 35 valores de mayor cotizacin de la bolsa espaola, representada en la figura 1.2.
Los autores, 2001; Edicions UPC, 2001.
p12 Series temporales
Lgicamente, el valor del IBEX35 depender del valor alcanzado en los das previos,
adems de recoger la influencia de un conjunto de factores sociales, polticos, econmicos,
etc., que son continuamente cambiantes en el tiempo y cuya conjuncin, en un determinado
instante, configurara una hipottica distribucin de probabilidad del citado ndice econmico.
En casos como ste, es evidente que puede obtenerse un modelo que explique el
comportamiento de la serie en el perodo estudiado, pero puede ser muy arriesgada la
utilizacin de este modelo para hacer previsiones a medio o largo plazo. As, en todas las
series cronolgicas, es necesaria una gran cautela en la previsin a causa de la muy
probable inestabilidad del modelo en un futuro ms o menos alejado del ltimo instante del
que se conocen datos.
3
3,5
4
4,5
5
enero diciembre
IBEX35
Fig. 1.2.- Evolucin del ndice IBEX35
Otro ejemplo puede ser el constituido por la sucesin de variables aleatorias {Y
1
, ...,Y
t
,...},
tales que
t t 1 t
Y 0,80Y
= + , con Y
0
= 0 y los
t
distribuidos N(0; 1), independientes para todo
t = 1, 2,...
Esta serie puede expresarse tambin como
t
t i
t i
i 1
Y 0,8
=
=
y la distribucin de
probabilidad de cualquier Y
t
corresponde a una ley Normal, con esperanza matemtica
t t
t i
t
i 1
1 0,8
E(Y) 0,8
0,2
= =
y variancia
t t
2(t i)
t
i 1
1 0,64
V(Y) 0,8
0,36
= =
.
La figura 1.3 muestra la ley de probabilidad de la variable Y en los instantes t = 1, t = 4 y t =
20, junto con la serie cronolgica compuesta por las 25 primeras observaciones de la
misma.
La particular forma de la informacin disponible de una serie cronolgica, n muestras de
tamao unidad procedentes de otras tantas poblaciones de distribucin y caractersticas
desconocidas, hacen que las tcnicas de inferencia estadstica, usualmente aplicadas en
muestras de tamao superior a la unidad, no sean vlidas para estos casos.
Los autores, 2001; Edicions UPC, 2001.
Introduccin p13
En los captulos siguientes se pretende presentar, de forma simple, distintos criterios
metodolgicos que permitan el estudio de estos fenmenos, y en particular la previsin de
su evolucin futura, para aplicarlos a campos tcnicos y econmicos, como por ejemplo
previsin de las ventas de una empresa, de los usuarios de un medio de transporte, de la
caracterstica de inters de un proceso continuo, etc.
Y
t
-10
-5
0
5
10
15
20
0 5 10 15 20 25
Fig. 1.3.- Distribucin de Y
t
y 25 observaciones de la serie
Todas las formas de estudio de una serie cronolgica, tal como se ir viendo, no conllevan
clculos complicados, pero s reiterativos, con gran volumen de datos manipulados y con
abundancia de grficos; es por ello que para su estudio se hace muy necesario el disponer
de un programa informtico que permita su correcta aplicacin y la obtencin de cuantos
grficos sean necesarios.
Los autores, 2001; Edicions UPC, 2001.
p14 Series temporales
2. ANLISIS DE UNA SERIE TEMPORAL
Antes de abordar cualquier estudio analtico de una serie temporal, se impone una
representacin grfica de la misma y la observacin detenida de su aspecto evolutivo.
Para estudiar el comportamiento de cualquier serie temporal, y predecir los valores que
puede tomar en un futuro, puede hablarse de distintas metodologas, que denominaremos
modelizacin por componentes y enfoque Box-Jenkins.
2.1 Modelizacion por componentes
Este mtodo consiste en identificar, en la serie Y
t
, cuatro componentes tericas, que no
tienen por qu existir todas, y que son:
Tendencia: T
t
.
Estacionalidad: E
t
.
Ciclos: C
t
.
Residuos: R
t
.
Cada una de estas componentes es una funcin del tiempo y el anlisis consistir en la
separacin y obtencin de cada una de ellas, as como en determinar de qu forma se
conjugan para dar lugar a la serie original. Estas componentes se pueden observar en la
figura 2.1, en donde se ha considerado que actan de forma aditiva para dar lugar a la serie
cronolgica.
La tendencia es la componente general a largo plazo y se suele expresar como una funcin
del tiempo de tipo polinmico o logartmico, por ejemplo T
t
=
0
+
1
t+
2
t
2
+
Las variaciones estacionales son oscilaciones que se producen, y repiten, en perodos de
tiempo cortos. Pueden estar asociadas a factores dinmicos, por ejemplo la ocupacin
hotelera, la venta de prendas de vestir, de juguetes, etc., cuya evolucin est claramente
ligada a la estacionalidad climtica, vacacional, publicitaria, etc.
Las variaciones cclicas se producen a largo plazo y suelen ir ligadas a etapas de
prosperidad o recesin econmica. Suelen ser tanto ms difciles de identificar cuanto ms
largo sea su perodo, debido, fundamentalmente, a que el tiempo de recogida de
informacin no aporta suficientes datos, por lo que a veces quedarn confundidas con las
otras componentes.
Los autores, 2001; Edicions UPC, 2001.
Anlisis de una serie temporal p15
TENDENCIA
ESTACIONALIDAD
CICLOS
RESIDUOS
100
125
150
175
200
-40
-20
0
20
40
-60
-30
0
30
60
-5
-3
0
3
5
0
100
200
300
SERIE
CRONOLGICA
Fig. 2.1.- Componentes de una serie cronolgica
La componente residual es la que recoge la aportacin aleatoria de cualquier fenmeno
sujeto al azar.
Los autores, 2001; Edicions UPC, 2001.
p16 Series temporales
Para evaluar las distintas componentes se utilizan tcnicas estadsticas tales como modelo
lineal, medias mviles, diferencias finitas, etc.
Admitiendo que el componente aleatorio (residuo) es aditivo, una vez identificadas las otras
componentes surge un nuevo problema que es el cmo conjuntar tendencia, estacionalidad
y ciclos para dar lugar a la serie definitiva.
As se proponen, entre otros, modelos genricamente denominados aditivos y
multiplicativos.
Modelo aditivo: Y = T + E + C + R
Modelo multiplicativo: Y = T x E x C + R
Para una primera identificacin visual del caso, se puede considerar que si el patrn
estacional se mantiene con amplitud constante se tratar de modelo aditivo (figuras 2.1 y
2.2). Cuando dicho patrn se vaya amplificando con el tiempo, ser multiplicativo (figura
2.3).
50
100
150
200
250
t
Y
Fig. 2.2.- Serie aditiva
0
100
200
300
400
t
Y
Fig. 2.3.- Serie multiplicativa
Los autores, 2001; Edicions UPC, 2001.
Anlisis de una serie temporal p17
Un modelo aditivo se puede interpretar como aquel en que la estacionalidad acta
modificando la ordenada en el origen de la tendencia.
Supongamos que no hay ciclos, que la tendencia es de tipo lineal, T
t
=
0
+
1
t, y que la
estacionalidad es de perodo p = 4, es decir, cada 4 unidades de tiempo se repite el patrn
(tal como ocurre en la figura 2.2). Representando sus valores por E
1
, E
2
, E
3
y E
4
,
respectivamente, el modelo aditivo se puede escribir como
Y
1
=
0
+
1
1 + E
1
+ R
1
=
1
+
1
1 + R
1
Y
2
=
0
+
1
2 + E
2
+ R
2
=
2
+
1
2 + R
2
Y
3
=
0
+
1
3 + E
3
+ R
3
=
3
+
1
3 + R
3
Y
4
=
0
+
1
4 + E
4
+ R
4
=
4
+
1
4 + R
4
Y
5
=
0
+
1
5 + E
1
+ R
5
=
1
+
1
5 + R
5
. .
Y
t
=
0
+
1
t + E
s
+ R
t
=
s
+
1
t + R
t
con t = p
$
+ s; s = 1, , p
As pues, cada estacin (s) componente del perodo conforma una recta con ordenada en el
origen distinta para cada caso y pendiente comn a todos; es decir, segn muestra la figura
2.4, el modelo es un conjunto de rectas paralelas, cada una de ellas asociada a una
estacin.
En el modelo multiplicativo, el componente estacional acta sobre la ordenada en el origen y
sobre la pendiente.
50
100
150
200
250
t
Y
Fig. 2.4.- Interpretacin de una serie con modelo aditivo
Prescindiendo de los ciclos, supuesta una tendencia lineal tipo T
t
=
0
+
1
t y una
estacionalidad de perodo p, para cualquier t = p
$
+ s, con s = 1, , p, resulta
Los autores, 2001; Edicions UPC, 2001.
p18 Series temporales
Y
t
= T
t
E
s
+ R
t
= (
0
+
1
t) E
s
+ R
t
,
es decir Y
t
= (
0
E
s
) + (
1
E
s
) t + R
t
o sea Y
t
=
0s
+
1s
t + R
t
De esta forma, cada una de las p estaciones del perodo configura una recta distinta, tanto
en lo que se refiere a la ordenada en el origen (
0s
) como a la pendiente (
1s
).
El conjunto de las p rectas constituye el modelo de comportamiento de la serie (figura 2.5).
Es evidente que esta divisin, en modelo estrictamente aditivo o estrictamente multiplicativo,
es bastante restrictiva, ya que puede darse el caso de que en algunas estaciones cambie
slo la pendiente, o slo la ordenada en el origen. Esto constituira un modelo mixto mucho
ms general que los propuestos hasta ahora, los cuales pasaran a ser meros casos
particulares de ste. En la figura 2.6 se presenta una situacin de este tipo.
0
100
200
300
400
500
t
Y
Fig. 2.5.- Interpretacin de una serie con modelo multiplicativo
0
50
100
150
200
t
Y
Fig. 2.6.- Modelo general
Los autores, 2001; Edicions UPC, 2001.
Anlisis de una serie temporal p19
2.2 Enfoque Box - Jenkins
La forma de encarar el anlisis de las series temporales a travs de la metodologa de Box-
Jenkins es dirigir el esfuerzo a determinar cul es el modelo probabilstico que rige el
comportamiento del fenmeno a lo largo del tiempo. Es decir, partiendo de la premisa de
que no siempre va a ser posible identificar los componentes de la serie, se trata de estudiar
el componente aleatorio puro, reflejado en los residuos.
La metodologa estadstica utilizada en el estudio de una serie temporal por este sistema, se
basa en los siguientes pasos:
Identificacin del modelo.
Estimacin de los parmetros.
Validacin de los supuestos admitidos en el anlisis, tambin llamado diagnosis del
modelo.
Para poder abordar esta metodologa es imprescindible, en primer lugar, estudiar un
conjunto de modelos de comportamiento que cubran el mayor espectro posible de los
procesos estocsticos objeto de nuestro inters. Entre ellos se pueden destacar los
procesos de ruido blanco, medias mviles (MA), autorregresivos (AR), integrados (I) y sus
conjunciones (ARMA y ARIMA). A partir de aqu se podr identificar la serie de datos con
alguno de los modelos estudiados, estimar sus parmetros y validar la admisibilidad del
modelo adoptado.
En general, se suele asumir que el componente aleatorio, el cual se representa por Z, sigue
una distribucin Normal de media cero y variancia
2
. Un proceso estocstico en que todos
sus componentes son independientes y estn constituidos slo por componente aleatorio se
denomina proceso de ruido blanco, es decir, Y
t
= Z
t
con Z
t
NINDEP(0;
2
) t.
Un proceso se denomina de media mvil de orden q, y se representa por MA(q), si su
estructura es del tipo Y
t
= Z
t
+
t-1
Z
t-1
+ +
t-q
Z
t-q
. En la figura 2.7 se muestra un MA(4).
-4
-3
-2
-1
0
1
2
3
4
t
Y
Fig. 2.7.- Proceso de media mvil MA(4)
Los autores, 2001; Edicions UPC, 2001.
p20 Series temporales
Un proceso es autorregresivo de orden p, y se representa por AR(p), cuando cada
componente es funcin de los anteriores ms el trmino aleatorio; su estructura corresponde
a
Y
t
= Z
t
+
t-1
Y
t-1
+ +
t-p
Y
t-p
En la figura 2.8 se muestra un AR(2).
Cuando a las estructuras de autorregresin y media mvil se une una dependencia con el
tiempo se llega a un ARIMA(p, r, q), donde p es el orden del AR, q el del MA y r el del
proceso integrado, o, lo que es lo mismo, el grado del polinomio que representa la funcin
del tiempo. En la figura 2.9 se presenta un proceso ARIMA(2,1,3).
-4
-3
-2
-1
0
1
2
3
4
t
Y
Fig. 2.8.- Proceso autorregresivo AR(2)
0
10
20
30
40
50
60
70
80
90
t
Y
Fig. 2.9.- Proceso ARIMA(2, 1, 3)
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p21
3 DESCOMPOSICIN DE UNA SERIE TEMPORAL
Este mtodo, tambin denominado sistema clsico, descompone la serie en tendencia,
estacionalidad, ciclos y residuos Una vez decidida la conjuncin entre ellos, aditiva o
multiplicativa, se obtiene el modelo con el que hacer previsiones.
La tendencia es la componente ms importante de la serie, al definir lo que se podra
interpretar como comportamiento a largo plazo. Cada observacin va ligada a un valor del
tiempo, lo que permite plantear un modelo del tipo
Y (t) = +
donde la funcin (t) puede ser:
lineal: (t) =
0
+
1
t
polinmica: (t) =
0
+
1
t +
2
t
2
+ ...
exponencial: (t) =
0
t
1
Si la serie no presenta estacionalidad, el mtodo de estimacin mnimo-cuadrtica y todas
las pruebas de hiptesis relativas a la explicacin del modelo y a la significacin de los
coeficientes estimados, propios del modelo lineal ordinario, permiten estimar los
coeficientes del modelo de tendencia sobre los datos directos.
Caso de existir componente estacional, para que sta no enmascare la tendencia, es
necesario estabilizar previamente la serie.
Para desarrollar la metodologa de la descomposicin clsica sobre un ejemplo, se dispone
de los datos relativos a las ventas de material deportivo en una gran superficie comercial,
recogidos en la tabla 3.I y representados en la figura 3.1. En esta tabla el tiempo (t) se ha
medido tomando como referencia el inicio del perodo de recogida de datos, y, en este caso,
su unidad es el trimestre.
La observacin de la figura 3.1, permite pensar en una tendencia lineal creciente y una
estacionalidad clara, cuyo patrn se repite anualmente, es decir, cada 4 valores del tiempo
(trimestres). Esto se puede interpretar como una tendencia sostenida de un aumento de las
ventas en esta superficie comercial, unida a un comportamiento distinto para cada uno de
los cuatro trimestres; debido, posiblemente, a que el precio del material deportivo es muy
distinto segn sea el adecuado para una estacin concreta (material de esqu frente a
entretenimiento de playa, por ejemplo). Por otra parte, el patrn estacional se mantiene con
una amplitud aproximadamente constante, lo que conduce a la utilizacin de un modelo
aditivo.
Los autores, 2001; Edicions UPC, 2001.
p22 Series temporales
Ao Trimestre Ventas (Y) t
1990 1
2
3
4
40,22
54,89
63,51
111,35
1
2
3
4
1991 1
2
3
4
46,95
51,62
61,47
108,58
5
6
7
8
1992 1
2
3
4
41,38
65,30
64,25
113,82
9
10
11
12
1993 1
2
3
4
53,34
59,37
66,15
121,5
13
14
15
16
1994 1
2
3
4
67,38
56,09
75,11
124,39
17
18
19
20
1995 1
2
3
4
55,90
61,25
75,44
126,50
21
22
23
24
Tabla 3.I.- Ventas de material deportivo
40
70
100
130
0 4 8 12 16 20 24 t
Y
Fig. 3.1.- Evolucin cronolgica de las ventas de material deportivo
En este ejemplo se ha identificado un patrn estacional compuesto por los cuatro trimestres
y que se repite de ao en ao, adems de una tendencia aparentemente lineal. Si se
decidiese ajustar el modelo de tendencia directamente sobre los datos, se obtendran los
resultados de la tabla 3.II.
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p23
nu S. C. C. M. F p-val
Regresin 1 1901,300 1901,300 2,677 0,116
Residuos 22 15623,686 710,168
Total 23 17524,985
Coef. Error tpico t p-val
Ord. Origen 57,501 11,229 5,121 0,000
t 1,286 0,786 1,636 0,116
R^2 = 0,10849
Tabla 3.II.- Modelo de tendencia ajustado sobre todos los datos: Y =
0
+
1
t +
El modelo presenta un coeficiente de determinacin (R^2) tan slo del 10,8% y no resulta
estadsticamente significativo, ya que el nivel de significacin (p-val), tanto del ajuste como
de la pendiente de la recta de tendencia, son claramente superiores a un riesgo de primera
especie del 5%. As, se demuestra que este procedimiento no es vlido ya que incluye en el
residuo todo el componente estacional, lo cual produce una inflacin de la suma de
cuadrados residual que desvirta el modelo y cualquier prueba de significacin de la
regresin y de sus coeficientes.
Para evitar esto es necesario estabilizar la serie liberndola de la estacionalidad; esto se
podra conseguir trabajando con los valores medios anuales, que son los de la tabla 3.III. En
la tabla 3.IV se detallan los resultados del clculo del modelo de tendencia, considerado tipo
rectilneo.
Y
a
t (aos) Y
a
t (aos)
67,4925
67,1550
71,1875
1
2
3
75,0900
80,7425
79,7725
4
5
6
Tabla 3.III.- Medias anuales de ventas de material deportivo
nu S.C. C.M. F p-val
Regresin 1 160,711 160,711 42,073 0,003
Residuos 4 15,279 3,820
Total 5 175,991
Coef. Error tpico t p-val
Ord. Origen 62,967 1,819 34,607 0,000
t(aos) 3,030 0,467 6,486 0,003
R^2 = 0,91318
Tabla 3.IV.- Modelo lineal para las medias anuales
Los autores, 2001; Edicions UPC, 2001.
p24 Series temporales
Ahora ya se ha obtenido un modelo de tendencia altamente significativo y con un buen
ajuste (R^2 = 91,3%). En la figura 3.2 se han representado las medias anuales junto a la
estimacin del modelo de tendencia; se observa la estabilizacin conseguida en los valores
de las medias anuales, ya que mientras los datos directos oscilaban entre 40 y 130, las
medias anuales van desde 67 hasta 81.
Hay que destacar que con esta estabilizacin se ha conseguido un modelo de tendencia
significativo; sin embargo, es aceptable este procedimiento? La respuesta sera no, ya que
este sistema tiene el inconveniente de la gran prdida de informacin, pues de los 24 datos
iniciales, se ha acabado estimando el modelo con slo 6 puntos. Este inconveniente queda
paliado desestacionalizando la serie con las medias mviles.
65
70
75
80
85
0 1 2 3 4 5 6 7
t(aos)
Y
a
Fig. 3.2.- Evolucin y tendencia de la media anual
3.1 Medias mviles: tendencia
Con este mtodo se consiguen suavizar tanto las oscilaciones peridicas de una serie como
las aleatorias. Su aplicacin requiere decidir, previamente, el perodo en que se repite cierto
patrn de comportamiento, que pueda atribuirse a variaciones estacionales; la observacin
de la evolucin grfica de la serie puede ayudar a tomar la decisin.
Una vez fijado el perodo p, se calculan las medias de los valores de la serie tomados de p
en p, sucesivamente desde el inicio. Asociando cada una de estas medias al valor del
tiempo del punto central del perodo estudiado, se obtiene una nueva serie de valores
mucho ms estables, debido, por una parte, a la reduccin de la variabilidad ocasionada al
promediar y, por otra, a que, si el perodo escogido es el correcto, al pasar de una media
mvil a la siguiente, el nuevo dato incorporado es del mismo comportamiento que el dato
saliente.
Si p es impar la asociacin es directa :
p + 1
t =
2
p
i
1 2 p
i 1
(p 1) / 2
Y
Y Y Y
Y
p p
=
+
+ + +
= =
A
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p25
p + 3
t =
2
p 1
i
2 3 p 1
i 2
(p 3) / 2
Y
Y Y Y
Y
p p
+
+
=
+
+ + +
= =
40,22
54,89
63,51
111,35
46,95
67,4925
69,1750
68,3337
3
4
5
&
s = 1, , p
donde s representa el ndice estacional y n
s
el nmero de valores asociados a este
ndice que se promedian.
Ya que los ndices estacionales miden discrepancias respecto a la media, sta se
necesita como valor de referencia; por tanto es necesario calcular la media general:
p
*
s
s = 1
E
E =
p
.
n Calcular los ndices estacionales en modelo multiplicativo.
En este caso, los ndices estacionales son el cociente entre los promedios de las
t
W de
cada estacin y la media general, es decir
*
s
s
E
E
E
=
Ahora, la suma de estos ndices es igual al perodo,
p
s
s 1
E p
=
=
. En modelo
multiplicativo, no es extrao que los ndices estacionales se representen en %.
En la tabla 3.VIII se detallan los clculos del caso de modelo aditivo de las ventas de
material deportivo. Por ejemplo, para el tercer trimestre (s = 3), el promedio de las Wt, cuyos
valores del tiempo correspondiesen al tercer trimestre, por ser mltiplos de 4 ms 3 (t = 3, 7,
11, 15, 19), sera:
*
3
-4,8237 - 4,9888 - 8,4325 - 10,6950 - 4,1975
= = - 6,6275
E
5
t
t
Y
t
Y
t
W Estacin: s
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
40,22
54,89
63,51
111,35
46,95
51,62
61,47
108,58
41,38
65,30
64,25
113,82
53,34
59,37
66,15
121,5
67,38
56,09
75,11
124,39
55,90
61,25
75,44
126,5
---
---
68,3337
68,7662
68,1025
67,5012
66,4588
67,4725
69,5300
70,5325
72,6825
73,4363
72,9325
74,1300
76,8450
78,1900
78,9000
80,3812
79,3075
78,5175
79,2037
79,5088
---
---
---
---
-4,8237
42,5838
-21,1525
-15,8812
-4,9888
41,1075
-28,1500
-5,2325
-8,4325
40,3837
-19,5925
-14,7600
-10,6950
43,3100
-11,5200
-24,2912
-4,1975
45,8725
-23,3037
-18,2588
---
---
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
Tabla 3.VIII.- Evaluacin de la estacionalidad por medias mviles.
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p29
Anlogamente, para cada trimestre, se obtiene:
* * * *
1 2 3 4
E 20,7438 E 15,68477 E 6,6275 E 42,6515 = = = =
La media general es:
4
*
s
s 1
E
E 0,101125
4
=
= =
$
s = 1, ..., p y
p
*
s
s 1
E
E
p
=
=
= =
= =
@ @
Con estas variables se plantea un modelo tipo
p p
Y = ( t ) + Q t +
Q
j j
j j
j 2 j = 2
+
=
donde (t) es una funcin polinmica del tiempo, o sea,
k
i
0 i
i 1
(t) + t
=
=
, que viene a
recoger la tendencia o evolucin general, a largo plazo, de los datos con el tiempo. Los
trminos del grupo
p
j j
j 2
Q
=
representan la influencia de la
estacionalidad sobre la funcin del tiempo, lo que en el mtodo clsico se interpreta como
parte multiplicativa.
El estudio de la significacin de cada uno de los coeficientes , y , y la consiguiente
eliminacin de los no significativos conducir el modelo que definitivamente explica el
comportamiento de la serie.
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p43
Para desarrollar la metodologa de las variables categricas sobre un ejemplo, se van a utilizar
los datos relativos a las ventas de material deportivo estudiados por el mtodo clsico, con el
fin de poder comparar posteriormente los resultados obtenidos. En la tabla 4.I se vuelven a
reproducir los datos de la serie cronolgica, junto a los valores de las variables categricas. La
representacin grfica de los mismos ya se present en la figura 3.1, cuya observacin
condujo a pensar en una tendencia lineal creciente y una estacionalidad de perodo p = 4.
A fin de no confundir los dos efectos, procede la creacin de variables categricas que
identifiquen cada una de las cuatro estaciones, que en este ejemplo constituyen el perodo
de repeticin del patrn estacional. Por otra parte, suponiendo que hubiese ciclos, el
intervalo de tiempo de recogida de datos es totalmente insuficiente para tomarlos, por lo que
su posible existencia quedar enmascarada en los residuos.
En la tabla 4.I estn las variables categricas Q2, Q3 y Q4, cuya conjuncin representa de
forma unvoca cada trimestre. Se insiste en que no es necesaria una Q1, puesto que el
primer trimestre es el que toma como referencia Q2 = Q3 = Q4 = 0, y son los dems que, a
travs del indicador, aportarn la parte del efecto estacional correspondiente.
En este caso, al ser la tendencia rectilnea, se plantea el modelo
0 1 2 2 3 3 4 4 2 2 3 3 4 4
Y t Q Q Q Q t Q t Q t = + + + + + + + +
La estimacin de sus parmetros conduce a los resultados expuestos en la tabla 4.II.
Ao Trimestre (s) Ventas (Y) Q
2
Q
3
Q
4
t
1990 1
2
3
4
40,22
54,89
63,51
111,35
0
1
0
0
0
0
1
0
0
0
0
1
1
2
3
4
1991 1
2
3
4
46,95
51,62
61,47
108,58
0
1
0
0
0
0
1
0
0
0
0
1
5
6
7
8
1992 1
2
3
4
41,38
65,30
64,25
113,82
0
1
0
0
0
0
1
0
0
0
0
1
9
10
11
12
1993 1
2
3
4
53,34
59,37
66,15
121,5
0
1
0
0
0
0
1
0
0
0
0
1
13
14
15
16
1994 1
2
3
4
67,38
56,09
75,11
124,39
0
1
0
0
0
0
1
0
0
0
0
1
17
18
19
20
1995 1
2
3
4
55,90
61,25
75,44
126,50
0
1
0
0
0
0
1
0
0
0
0
1
21
22
23
24
Tabla 4.I.- Ventas de material deportivo
Los autores, 2001; Edicions UPC, 2001.
p44 Series temporales
Los resultados del modelo lineal general evidencian que todos los trminos del tipo Q
j
t no
son estadsticamente significativos, (p-val < 0,05), por tanto procede recalcular el modelo
prescindiendo de ellos.
Cabe destacar que este hecho manifiesta que la estacionalidad no modifica la pendiente de
la recta del tiempo, es decir, el incremento de las ventas es el mismo para cada trimestre.
Esto simplifica el caso al corresponder a un modelo aditivo puro, que puede ser,
alternativamente, estudiado por la metodologa de la descomposicin clsica, tal como se ha
hecho en el captulo 3. Si alguno de esos trminos hubiese resultado significativo, el sistema
clsico proporcionara un modelo bastante precario.
nu S.C. C.M. F p-val
Regresin 7 17166,997 2452,428 109,609 0,000
Residuos 16 357,988 22,374
Total 23 17524,985
Coeficientes Error tpico t p-val
Ord. Origen 38,9463 3,660 10,640 0,000
Q2 15,7735 5,351 2,948 0,009
Q3 19,1936 5,535 3,468 0,003
Q4 65,6577 5,726 11,466 0,000
t 1,0832 0,283 3,832 0,001
t*Q2 -0,8026 0,400 -2,008 0,062
t*Q3 -0,3513 0,400 -0,879 0,393
t*Q4 -0,1485 0,400 -0,371 0,715
R^2 = 0,9796
Tabla 4.II.- Resultados del modelo lineal general
La tabla 4.III contiene los resultados del ajuste del modelo definitivo, es decir, de
0 1 2 2 3 3 4 4
Y t Q Q Q = + + + + +
nu S.C. C.M. F p-val
Regresin 4 17064,626 4266,157 176,073 0,000
Residuos 19 460,359 24,229
Total 23 17524,985
Coeficientes Error tpico t p-val
Ord. Origen 42,5280 2,580 16,484 0,000
Q2 6,4674 2,846 2,273 0,035
Q3 15,2781 2,857 5,347 0,000
Q4 64,5555 2,876 22,447 0,000
t 0,7576 0,147 5,151 0,000
R^2 = 0,97373
Tabla 4.III.- Resultados del modelo definitivo
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p45
Los grficos de residuos y probabilstico Normal se presentan en la figura 4.1, y no
presentan ninguna peculiaridad especial.
En consecuencia queda validado el modelo obtenido.
Res
4 7
0
Y
Res
0 4 8
0
t
%P
0
9
Res
Fig. 4.1.- Grficos de los residuos del modelo
Como resumen de todo lo anterior, el modelo que explica el comportamiento de la serie, y
que va a ser utilizado para hacer previsiones de las ventas futuras, ha resultado ser
t 2 3 4
Y 42,5280 0,7576t 6,4674Q 15,2781Q 64,5555Q = + + + +
#
La interpretacin de los coeficientes del modelo permite identificar tendencia y
estacionalidad.
En cuanto a la primera, se detecta un incremento de las ventas de 0,7576 unidades cada
unidad de tiempo (trimestre); incremento que se mantiene constante sea cual sea la
estacin.
En consecuencia, la estacionalidad slo afecta a la ordenada en el origen de cada una de
las cuatro estaciones (trimestres) que componen el perodo.
Tomando como referencia el primer trimestre, en el que Q
2
= Q
3
= Q
4
= 0, se observa que en
l las ventas dependen del tiempo, segn la ecuacin
t
Y
#
= 42,5280 + 0,7576 t con t = 1 + 4
$
Los autores, 2001; Edicions UPC, 2001.
p46 Series temporales
Para un tiempo correspondiente a un segundo trimestre, las variables categricas toman los
valores Q
2
= 1 y Q
3
= Q
4
= 0 y el modelo es
t
Y
#
= 42,5280 + 0,7576 t + 6,4674 = 48,9954 + 0,7576 t con t = 2 + 4
$
Para un tiempo de tercer trimestre, las variables categricas toman los valores Q
3
= 1 y Q
2
=
Q
4
= 0 y el modelo es
t
Y
#
= 42,5280 + 0,7576 t + 15,2781 = 57,8061 + 0,7576 t con t = 3 + 4
$
Y, en el caso del cuarto trimestre, las variables categricas toman los valores Q
4
= 1 y
Q
2
= Q
3
= 0; el modelo es
t
Y
#
= 42,5280 + 0,7576 t + 64,5555 = 107,0835 + 0,7576 t con t = 4 + 4
$
As, para cada trimestre (estacin del perodo), se obtiene un modelo del mismo tipo,
rectilneo con igual pendiente, en este caso, pero con distinta ordenada en el origen.
Esto se puede interpretar como que, tomando siempre como referencia el primer trimestre,
en el segundo el volumen de ventas aade a la funcin del tiempo 6,4674 unidades, en el
tercero el incremento es de 15,2782 y en el cuarto de 64,5555 unidades. Estos valores son,
evidentemente, los coeficientes de las variables categricas.
En consecuencia los coeficientes de las variables categricas representan la cantidad en
que una estacin, sistemticamente, supera (o no alcanza, segn sea el signo) el valor de la
primera estacin del perodo. Es decir, estos coeficientes son una forma de medir el
componente estacional.
Para evaluar la bondad del modelo, en la figura 4.2 se muestra la comparacin de los
valores medidos con los estimados a partir del modelo ajustado; se observa la buena
concordancia entre ambos.
La modelizacin tiene como objetivo principal el poder hacer previsiones para un futuro
prximo. En este caso se procede a calcular las previsiones para los prximos 2 aos, a
base de sustituir los valores del tiempo y de las variables categricas en el modelo obtenido.
Los resultados se muestran en la tabla 4.IV y en la figura 4.3.
40
70
100
130
0 4 8 12 16 20 24 t
Y
Fig. 4.2.- Datos reales ( ) y modelo ajustado ( )
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p47
Aqu se detecta la coherencia de la previsin con los datos histricos, siempre que no
cambie el modelo de comportamiento de la serie en el perodo previsto. Esto podra ocurrir,
por ejemplo, si hubiese una recesin econmica, la apertura de otro comercio de similares
caractersticas en las inmediaciones, un cambio de hbitos en la poblacin, una campaa
propagandstica con xito de la competencia, etc.
t 2 3 4
Y 42,5280 0,7576t 6,4674Q 15,2781Q 64,5555Q = + + + +
#
Ao t Q
2
Q
3
Q
4
t
Y
#
1996 25
26
27
28
0
1
0
0
0
0
1
0
0
0
0
1
61,4680
68,6930
78,2613
128,2963
1997 29
30
31
32
0
1
0
0
0
0
1
0
0
0
0
1
64,4984
71,7234
81,2917
131,3267
Tabla 4.IV.- Previsiones para 1996 y 1997
Y
40
90
140
0 4 8 12 16 20 24 28 32
t
1990 1995 1996 1997
datos previsiones
Fig. 4.3.- Datos, modelo y previsiones para los dos aos siguientes
Los autores, 2001; Edicions UPC, 2001.
p48 Series temporales
4.1 Comparacin del mtodo de descomposicin con el de variables categricas
Se han expuesto dos mtodos para la descomposicin de la serie y ambos se han aplicado
a un caso de modelo aditivo puro, es decir, en el que la estacionalidad no afecta a la
pendiente de la recta de tendencia. El de variables categricas es ms simple en cuanto a
manipulacin y clculos, aunque, si el perodo tiene muchas componentes, adquiere mayor
aparatosidad por el nmero de variables categricas que se manejan. El clsico, que
identifica los componentes del modelo por medio del uso de medias mviles, conduce a
resultados similares, en un caso en que se insiste que es aditivo puro; en casos ms
generales la descomposicin clsica no sera capaz de conseguir un buen modelo.
La comparacin de ambos, sobre el ejemplo desarrollado, se presenta en las figuras 4.4 y
4.5. La primera compara los resultados de los dos modelos dentro del perodo de recogida
de informacin; la segunda confronta los valores de los residuos obtenidos mediante los dos
sistemas. Ambos grficos confirman la gran concordancia de los resultados.
En las tablas 3.IX y 4.IV se han presentado las previsiones de ventas del material deportivo
para los ocho trimestres siguientes a la recogida de informacin, es decir, para los aos
1996 y 1997, siempre bajo el supuesto que el comportamiento de la serie no va a cambiar
en este perodo de tiempo. La figura 4.6 da idea de la casi coincidencia de las previsiones
para las dos formas de anlisis estudiadas.
40
70
100
130
0 4 8 12 16 20 24 t
V
a
l
o
r
e
s
m
o
d
e
l
i
z
a
d
o
s
Fig. 4.4.- Modelo segn la descomposicin clsica ( ) y las variables categricas ( )
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p49
-10
-5
0
5
10
15
-10 -5 0 5 10 15
R(descomp. clsica)
R
(
c
a
t
e
g
r
i
c
a
s
)
Fig. 4.5.- Residuos de la descomposicin frente a los del modelo en variables categricas
Ya que el objetivo del sistema clsico es descomponer la serie como un modelo aditivo, o
multiplicativo si fuese el caso, de tendencia, estacionalidad, ciclos y residuos, es necesario
identificar cada componente.
40
65
90
115
140
24 28 32
t
P
r
e
v
i
s
i
o
n
e
s
Fig. 4.6.- Previsiones para los dos aos siguientes segn la descomposicin clsica ( )
y las variables categricas ( )
Refirindonos slo a tendencia y estacionalidad, y considerando el modelo puramente
aditivo, como es el caso de los datos de las ventas de material deportivo, se tratar de pasar
del modelo en variables categricas
q p
i
t 0 i j j
i = 1 j = 2
= + +
Q t Y
L o s a u t o r e s , 2 0 0 1 ; E d i c i o n s U P C , 2 0 0 1 .
p50 Series temporales
a otro con sus componentes aisladas. Considerando el modelo aditivo, y suponiendo que los
ciclos, caso de existir, no sean identificables con los datos disponibles, tendremos
Y
t
=T
t
+ E
t
En este caso, despus de estabilizar la serie, se habr modelizado la tendencia como
q
i
t 0 i
i 1
T = a t
=
+
Debido a que es posible tener dos contadores del tiempo, uno asociado al momento de toma
de datos y otro que identifica la estacin a la que pertenece el dato, cualquier instante t
puede escribirse como t = s + k p = s + p
$
, con k = 0, 1, 2, y s = 1, 2,..., p, es decir, t
es un mltiplo del perodo, p, ms el indicador de la estacin, s. As, resulta
q
i
t t t 0 i s
i 1
Y = T E a t E
=
+ = + +
donde
p
s
s = 1
= 0
E
de donde se deduce la expresin que da directamente la tendencia global, T, en funcin de
los parmetros estimados en el modelo de variables categricas:
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p51
p
j
q
j = 2 i
t 0 i
i 1
T + + t
p
=
=
Para cualquier estacin, s, componente del perodo p, el modelo en variables categricas
puede escribirse como
q
i
t 0 i s
i 1
Y + t
=
= +
s = 1, , p t = s + p
$
Al ser la estacionalidad
s t s p t s p
E Y T
= + = +
=
$ $
, restando las dos ltimas expresiones de Y
t
y
T
t
resulta
p
j
j 2
s s
E =
p
=
Para el caso del ejemplo del material deportivo, p = 4, con variables categricas se obtuvo el
modelo
t 2 3 4
Y 42,5280 0,7576t 6,4674Q 15,2781Q 64,5555Q = + + + +
#
del cual resulta
4
j
j = 2
= 21,57525
4
. A partir de este modelo la ecuacin pura de la tendencia,
o esqueleto de la serie, es
p
j
q
j = 2 i
t 0 i
i 1
T + + t
p
=
=
.
Estos valores, como era de esperar, son muy similares a los obtenidos por la
descomposicin clsica (captulo 3), que resultaron ser 20,6426; 15,5836; 6,5264 y
42,7526, respectivamente.
Como resumen, se puede reiterar la gran similitud de valores de los coeficientes del modelo
de tendencia y de los ndices estacionales obtenidos por los dos mtodos desarrollados.
Esta concordancia es buena para un caso como el que se acaba de estudiar, que se podra
etiquetar como modelo aditivo puro. Si se hubiera dado la circunstancia de una serie donde
la estacionalidad hubiese afectado a la tendencia de distinta forma en cada componente del
perodo, es decir, variando ya la pendiente, ya la ordenada en el origen, la descomposicin
clsica no hubiese conseguido modelizarla correctamente.
Es por todo ello que se puede afirmar que la modelizacin global con variables categricas
es un procedimiento mucho ms general para el estudio del comportamiento de una serie
temporal y la realizacin de previsiones.
4.2 Caso usuarios de un telfono
En la tabla 4.5 se exponen unos datos cronolgicos correspondientes al nmero de usuarios
de un telfono de atencin al cliente de lunes a viernes, recogidos durante las 12 primeras
semanas de puesta en marcha del servicio.
t Y t Y t Y t Y
1 99,30 16 117,66 31 127,52 46 149,66
2 65,27 17 52,67 32 30,42 47 34,13
3 48,27 18 63,96 33 92,71 48 118,31
4 20,58 19 40,85 34 60,22 49 64,06
5 75,17 20 76,12 35 88,61 50 106,09
6 104,76 21 116,48 36 136,60 51 150,28
7 58,96 22 52,86 37 32,16 52 25,74
8 67,18 23 79,80 38 104,76 53 114,62
9 28,44 24 44,25 39 60,62 54 74,64
10 83,71 25 88,39 40 93,53 55 106,34
11 121,13 26 125,34 41 142,92 56 149,02
12 51,52 27 46,45 42 33,34 57 29,06
13 64,30 28 80,05 43 103,53 58 121,42
14 25,60 29 50,67 44 68,86 59 76,33
15 76,50 30 94,03 45 92,50 60 114,29
Tabla 4.V.- Usuarios del telfono de atencin al cliente
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p53
En la figura 4.7 se muestra la evolucin de la demanda de utilizacin de este servicio, y se
observa que la simplicidad del mtodo clsico de considerar la serie aditiva o multiplicativa,
no est nada clara pues el patrn estacional ni se mantiene constante ni se amplifica
sistemticamente.
Es natural que, de haber estacionalidad, sta sea de perodo 5, correspondiente a posibles
diferencias de utilizacin de dicho servicio en los distintos das de la semana. La observacin
del grfico confirma esta estacionalidad. En cuanto a la tendencia, tampoco se ve muy claro si
la hay; si se observan los datos del primer da de cada semana (lunes) parece que haya un
crecimiento sostenido de la demanda, mientras que viendo el comportamiento de los martes
(tabla 4.V) la tendencia es a una disminucin. Si slo se dispusiese del mtodo clsico de
descomposicin de la serie sera difcil analizar esta situacin, ya que la tendencia general, all
definida como esqueleto de la serie, parece mantenerse ms o menos constante.
0
40
80
120
160
0 20 40 60
t
Y
Fig. 4.7.- Evolucin cronolgica de la demanda
Aplicando la sistemtica de anlisis de variables categricas, corresponde definir 4
variables, Q
2
, Q
3
, Q
4
y Q
5
, que identificarn cada uno de los cinco das de la semana. En la
tabla 4.VI, se muestra un fragmento de los valores de dichas variables asociados a los datos
disponibles.
t Y Q2 Q3 Q4 Q5
1 99,3 0 0 0 0
2 65,27 1 0 0 0
3 48,27 0 1 0 0
4 20,58 0 0 1 0
5 75,17 0 0 0 1
6 104,76 0 0 0 0
7 58,96 1 0 0 0
8 67,18 0 1 0 0
9 28,44 0 0 1 0
10 83,71 0 0 0 1
11 121,13 0 0 0 0
12 51,52 1 0 0 0
... ... ... ... ... ...
Tabla 4. VI.- Variables categricas
Los autores, 2001; Edicions UPC, 2001.
p54 Series temporales
El modelo inicial que debe plantearse es del tipo
0 1 2 2 3 3 4 4 5 5 2 2 3 3 4 4 5 5
Y t Q Q Q Q Q t Q t Q t Q t = + + + + + + + + + +
y los resultados de la estimacin mnimo-cuadrtica de los coeficientes se muestran en la
tabla 4.VII. De ella se deduce que el trmino t=Q
4
no es significativo (p-val > 0,05) y puede
ser eliminado del modelo. Al recalcular el nuevo modelo se obtienen los resultados
mostrados en la tabla 4.VIII.
nu S.C. C.M. F p-val
Regresin 9 73631,982 8181,331 355,132 0,000
Residuos 50 1151,873 23,037
Total 59 74783,855
Coef. Error tpico t p-val
Ord. Origen 101,580 2,675 37,978 0,000
Q2 -38,364 3,832 -10,012 0,000
Q3 -53,757 3,882 -13,849 0,000
Q4 -83,296 3,933 -21,179 0,000
Q5 -31,512 3,985 -7,908 0,000
t 0,941 0,080 11,718 0,000
t*Q2 -1,636 0,114 -14,408 0,000
t*Q3 0,385 0,114 3,387 0,001
t*Q4 0,106 0,114 0,935 0,354
t*Q5 -0,288 0,114 -2,539 0,014
R^2 = 0,9846
Tabla 4.VII.- Resultados del modelo lineal inicial
nu S.C. C.M. F p-val
Regresin 8 73611,831 9201,479 400,398 0,000
Residuos 51 1172,023 22,981
Total 59 74783,855
Coef. Error tpico t p-val
Ord. Origen 100,067 2,127 47,038 0,000
Q2 -36,851 3,469 -10,622 0,000
Q3 -52,244 3,524 -14,824 0,000
Q4 -80,110 1,964 -40,780 0,000
Q5 -29,999 3,637 -8,247 0,000
t 0,994 0,057 17,529 0,000
t*Q2 -1,689 0,098 -17,198 0,000
t*Q3 0,331 0,098 3,376 0,001
t*Q5 -0,341 0,098 -3,476 0,001
R^2 = 0,9843
Tabla 4.VIII.- Resultados del modelo lineal definitivo
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p55
El modelo que explica el comportamiento de la serie presenta un elevado grado de ajuste
(R
2
= 98,43%) y, segn los coeficientes de la tabla 4.VIII, toma la expresin
t
Y
#
= 100,07 36,85 Q
2
52,24 Q
3
80,11 Q
4
30 Q
5
+ 0,99 t 1,69 t Q
2
+ 0,33 t Q
3
0,34 t Q
5
La figura 4.8 presenta el modelo ajustado junto a los datos, y la figura 4.9 los residuos del
modelo. Se observa que la mayora de los valores estn en el intervalo 4 unidades, y slo
en algn caso la discrepancias alcanza 10 unidades; ello confirma el buen ajuste.
Y
0
40
80
120
160
200
0 20 40 60 t
Fig. 4.8.- Datos experimentales ( ) y modelo ajustado ( )
-12
-8
-4
0
4
8
12
0 20 40 60
t
R
Fig. 4.9.- Residuos del modelo: R = Y Y
#
La interpretacin del modelo obtenido, se puede hacer determinando la ecuacin de
previsin asociada a cada uno de los das de la semana, es decir, a cada componente de la
estacin. A ttulo de ejemplo, los modelos para el lunes y el viernes son:
Los autores, 2001; Edicions UPC, 2001.
p56 Series temporales
Lunes: s = 1 Q
2
= Q
3
= Q
4
= Q
5
= 0 Y
#
= 100,07 + 0,99 t con t =5
$
+1
Viernes: s = 5 Q
2
= Q
3
= Q
4
= 0 Q
5
= 1 Y
#
= 70,07 + 0,65 t con t =5
$
+5
En la figura 4.10, se puede observar cada una de las cinco rectas que componen el modelo,
sobre el fondo de los datos experimentales. Cada recta, a la derecha del grfico, lleva el
indicador estacional que le corresponde (lunes: s =1; martes: s = 2). De la ecuacin del
modelo general y del estudio de este grfico se puede concluir que el lunes y el jueves
tienen la misma tendencia (las rectas 1 y 4 son paralelas); sin embargo el lunes tiene,
sistemticamente, un mayor nmero de usuarios que el jueves. Esta discrepancia constante
es la diferencia de ordenadas de ambas rectas, o sea el coeficiente de Q
4
, que en este caso
es igual a 80,11. La tendencia comn indica un aumento sostenido de usuarios que se
evala en un incremento de 0,99 usuarios al da (coeficiente de t en las rectas 1 y 4).
0
40
80
120
160
0 20 40 60
Y
1
3
5
4
2
t
Fig. 4.10.- Modelos asociados a cada da de la semana
En cuanto a los mircoles y viernes (rectas 3 y 5), se puede decir que tienen un
comportamiento similar. En los primeros das haba algo ms de usuarios el viernes que el
mircoles; sin embargo, dicho nmero ha aumentado en ambos, pero con mayor velocidad
el mircoles, de forma que actualmente ste ya supera al viernes.
Especial atencin merece el martes (recta 2), ya que inicialmente tena un nmero de
usuarios situado ms o menos en el promedio de los otros das, pero ha sufrido un
decrecimiento progresivo que actualmente lo sita en un valor muy inferior a los dems das
de la semana, los cuales, en mayor o menor grado, han presentado un incremento de
demanda del servicio.
Est claro que, en la prctica, una situacin como sta requerira de un estudio en
profundidad de las causas que han conducido a esta situacin: quizs la persona que
atiende la lnea no es la misma, o hay mayores dificultades para establecer comunicacin y
el pblico deja de llamar los martes,...
La obtencin del modelo tiene como principal objetivo el poder hacer previsiones del
comportamiento de la demanda del servicio durante los prximos das, a fin de programar un
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p57
aumento del nmero de lneas telefnicas, del nmero de personas que atienden a los
usuarios, plantearse una redistribucin en el tiempo, etc.
La tabla 4.IX muestra las previsiones para las dos semanas prximas, junto a los valores del
tiempo y de las variables categricas, necesarios para ser sustituidos en el modelo general.
t Q2 Q3 Q4 Q5 Y prevista
61 0 0 0 0 160,686
62 1 0 0 0 20,129
63 0 1 0 0 131,312
64 0 0 1 0 83,557
65 0 0 0 1 112,478
66 0 0 0 0 165,655
67 1 0 0 0 16,654
68 0 1 0 0 137,938
69 0 0 1 0 88,526
70 0 0 0 1 115,741
Tabla 4.IX.- Previsiones para dos semanas
En la figura 4.11 se pueden observar los valores de las previsiones como extrapolacin del
modelo ajustado sobre los datos disponibles, constatndose la gran disminucin del nmero
de usuarios del martes.
0
30
60
90
120
150
180
0 10 20 30 40 50 60 70 t
Y
Fig. 4.11. - Datos ( ), modelo ( --- ) y previsiones (1)
Dichas previsiones sern vlidas siempre que se mantenga el modelo de comportamiento
que han puesto de manifiesto los datos disponibles. Es evidente que si se encontrase la
causa de la disminucin de llamadas producida en los martes, y se corrigiese, sera
necesario llevar a cabo una nueva recogida de informacin para elaborar los modelos
correspondientes y hacer previsiones en la nueva situacin.
Los autores, 2001; Edicions UPC, 2001.
p58 Series temporales
5 AUTOCORRELACIN
En este captulo se presenta una herramienta de anlisis, el correlograma, o representacin
grfica de la funcin de autocorrelacin, que tiene una doble utilidad. Por una parte, puede
servir para confirmar la presencia de estacionalidad y determinar su perodo; por otra, indica
cuntas previsiones son admisibles, a partir del ltimo tiempo de recogida de informacin.
El concepto de autocorrelacin es bien simple; supongamos que se dispone de la serie
cronolgica Y
1
, Y
2
,... , Y
1+k
,... , Y
N
, y se desplaza dicha serie k unidades de tiempo; se
pueden formar las parejas (Y
1
; Y
1+k
), (Y
2
; Y
2+k
), (Y
3
; Y
3+k
),..., (Y
Nk
; Y
N
).
El coeficiente de correlacin entre ambas series, es decir, de las parejas citadas, se denota
por
k
y recibe el nombre de coeficiente de autocorrelacin de orden k; el desplazamiento k
tambin se denomina retardo, y representando grficamente
k
en funcin del retardo k, se
obtiene el autocorrelograma de la serie. De la estructura del planteamiento se deduce que
k
=
k
.
5.1 Correlograma
Un valor no nulo de
k
indica que existe correlacin entre informaciones separadas k
unidades de tiempo, es decir, la historia se transmite k unidades de tiempo ms all. En
consecuencia, si el ltimo valor del tiempo del que se dispone de datos es el T, ser
admisible hacer previsiones para un tiempo igual a T+k. Evidentemente, si
k
fuese nulo,
sera inadmisible una prediccin para T+k, ya que los datos disponibles no transmiten
ninguna informacin relevante a una distancia como la considerada.
Sea que se dispone de una serie cronolgica de datos y
1
, y
2
,..., y
t
,..., y
N
, para elaborar el
correlograma o grfico de la funcin de autocorrelacin. Se estiman las siguientes
caractersticas:
Media:
N
i
i 1
y
m y
N
=
= =
Autocovariancia:
N k
i i k
i 1
k
(y y) (y y)
+
=
=
k = 0, 1,..., N1
Autocorrelacin:
k
k k
0
= =
k K
al sustituir
i
por su estimador, r
i
, y, dado que
0
= 1 y
i
=
i
, resulta que la estimacin de la
variancia de r
k
es igual a
k
K 1
2
k i K 1
2 (K 1)
k i
1
1
V(r ) k K K 1
N 1
V(r ) r
1 N
V(r ) 1 2 r k K K 1
N
'
_
+ >
S(r ) V(r ) .
El intervalo t 2 S(r
k
) se denomina intervalo de no significacin de
k
, y es el conjunto de
valores que puede tomar r
k
para que, con un riesgo del 5%, se pueda admitir la ausencia de
correlacin entre valores de la serie, desplazados k unidades de tiempo. Por todo ello, al
calcular la funcin de autocorrelacin de una serie, es bueno representarla grficamente
junto al intervalo 2 S(r
k
), con objeto de considerar nicamente como coeficientes de
autocorrelacin no nulos aquellos cuya estimacin est fuera del citado intervalo.
Las autocorrelaciones suelen disponerse matricialmente, lo que da lugar a la matriz de
autocorrelaciones P
N
, simtrica, definida positiva, cuya estructura es
1 2 N - 1
1 1 N - 2
N
2 1 N - 3
N - 1 N - 2 N - 3
1 . . . . .
1 . . . . .
1 . . . . . =
P
. . . . . . . . . . . . . . . . .
. . . . . 1
_
,
Como aplicacin se va a analizar la serie cronolgica de la tabla 5.I, que corresponde al
valor de los stocks en I.C.I. (Serie D* de Time Series Analysis and Forecasting, O.D.
Anderson, ed. Butterworths, 1977). Su evolucin se muestra en la figura 5.1.
Los autores, 2001; Edicions UPC, 2001.
p60 Series temporales
t Y t Y t Y t Y t Y t Y
1 304 19 278 37 282 55 273 73 291 91 282
2 303 20 277 38 283 56 272 74 288 92 286
3 307 21 279 39 279 57 273 75 288 93 286
4 299 22 278 40 280 58 271 76 290 94 287
5 296 23 270 41 280 59 272 77 293 95 284
6 293 24 268 42 279 60 271 78 288 96 283
7 301 25 272 43 278 61 273 79 289 97 286
8 293 26 273 44 283 62 277 80 291 98 282
9 301 27 279 45 278 63 274 81 293 99 287
10 295 28 279 46 270 64 274 82 293 100 286
11 284 29 280 47 275 65 272 83 290 101 287
12 286 30 275 48 273 66 280 84 288 102 292
13 286 31 271 49 273 67 282 85 287 103 292
14 287 32 277 50 272 68 292 86 289 104 294
15 284 33 278 51 275 69 295 87 292 105 291
16 282 34 279 52 273 70 295 88 288 106 288
17 278 35 283 53 273 71 294 89 288 107 289
18 281 36 284 54 272 72 290 90 285
Tabla 5.I.- Valor de los stocks en I.C.I
260
270
280
290
300
310
0 40 80 120 t
Y
Fig. 5.1.- Evolucin de la serie de la tabla 5.I
En la tabla 5.II se presenta el detalle del clculo de las autocorrelaciones para los casos de
k =1 y k = 2, de los valores de la tabla 5.I. En primer lugar es necesario calcular la media de
todos los datos
1
m = y = ( 304 + . . . + 295 ) = 299,2
10
Los autores, 2001; Edicions UPC, 2001.
Autocorrelacin p61
t 1 2 3 4 5 ... 105 106 107
y 304 303 307 299 296 291 288 289
k = 0
y - y 20,44 19,44 23,44 15,44 12,44 ... 7,44 4,44 5,44
y 304 303 307 299 ... 294 291 288
k = 1
y - y 20,44 19,44 23,44 15,44 ... 10,44 7,44 4,44
y 304 303 307 ... 292 294 291
k = 2
y - y 20,44 19,44 23,44 ... 8,44 10,44 7,44
Tabla 5.II.- Detalle del clculo de las autocorrelaciones de la tabla 5.I
Las estimaciones se obtienen como
2 2 107
2
0 i
1
1 20,44 ... 5,44
= ( - y = 74,695 y )
107 107
+ +
=
107
1 i i - 1
2
1 19,44 20,44 ... 5,44 4,44
= ( - y ) ( - y ) 66,123 y y
107 107
+ +
= =
1
1 1
0
66,123
r 0,885
74,695
= = = =
107
2 i i - 2
3
1 23,44 20,44 ... 5,44 7,44
= ( - y ) ( - y ) 59,775 y y
107 107
+ +
= =
2
2 2
0
59,775
r 0,800
74,695
= = = =
etc.
Segn Bartlett las desviaciones tipo estimadas para r
1
y r
2
son:
1
1 1
S(r ) 0,097
N 107
= = =
( )
2
2
2 1
1 1 2 0,885
S(r ) 1 2 r 0,155
N 107
+
= + = =
etc.
Los autores, 2001; Edicions UPC, 2001.
p62 Series temporales
Y los intervalos 2 S(r
k
) son, respectivamente, 0,194 y 0,310 para k=1 y k=2. En
consecuencia, con un riesgo del 5%,
1
y
2
pueden ser significativamente distintos de cero.
Analizando los 107 valores de la serie completa para k = 1, 2,..., 10, se obtienen los valores
mostrados en la tabla 5.III y presentados en la figura 5.2. De estos resultados, se verifica
que a partir de k = 7 ya se puede considerar
k
como nulo, es decir, no es admisible hacer
previsiones separadas en ms de 7 unidades de tiempo del ltimo momento de recogida de
datos.
k 1 2 3 4 5 6 7 8 9 10
r
k
0,89 0,80 0,70 0,63 0,58 0,55 0,48 0,40 0,31 0,23
S(r
k
) 0,10 0,15 0,19 0,21 0,23 0,24 0,25 0,26 0,27 0,27
Tabla 5.III.- Valores de las autocorrelaciones y sus desviaciones tipo
-1
-0,5
0
0,5
1
k
r
k
Fig. 5.2.- Correlograma
Con los valores de la tabla 5.III, se puede escribir la matriz de autocorrelaciones que, para k
=3, adquiere la siguiente forma:
3
1 0,885 0,800 0,699
0,885 1 0,885 0,800
=
P
0,800 0,885 1 0,885
0,699 0,800 0,885 1
L o s a u t o r e s , 2 0 0 1 ; E d i c i o n s U P C , 2 0 0 1 .
Autocorrelacin p63
5.2 Interpretacion de los correlogramas
En la figura 5.3 se muestran los correlogramas de las series analizadas hasta ahora.
El primero, que corresponde a los datos de la figura 1.2 de la evolucin del ndice IBEX35,
muestra que slo son significativos los tres primeros coeficientes de autocorrelacin; por
tanto, las previsiones dejan de ser vlidas a partir de tres unidades de tiempo despus del
ltimo dato. Es decir, lo que ocurra en un instante se transmite hasta tres unidades de
tiempo ms adelante.
El segundo, de los datos de la tabla 3.I y de la figura 3.1 sobre las ventas trimestrales de
material deportivo, confirma la estacionalidad de perodo cuatro, ya que cada cuatro barras
de autocorrelacin se repite la misma estructura de comportamiento. En este caso es
posible hacer previsiones a cuatro trimestres vista, ya que para k = 4 el coeficiente de
autocorrelacin es significativamente distinto de cero, aunque no lo sean los de k = 1, 2 y 3.
Este hecho se puede interpretar como que la informacin de un trimestre se transmite
directamente hasta una distancia temporal de cuatro trimestres, sin que afecte el
comportamiento de los tres trimestres intermedios. As, por ejemplo, una vez conocidas las
ventas de invierno, se puede hacer la previsin para el invierno prximo puesto que lo que
ocurra en primavera, verano y otoo no afectar al invierno siguiente.
El tercero y el cuarto corresponden, respectivamente, a las temperaturas medias mensuales
(tabla 3.X y figura 3.6), y a los usuarios mensuales de un transporte pblico (tabla 3.XIV y
figura 3.12). En ambos casos se confirma la estacionalidad de perodo 12, y se pueden
hacer previsiones a 18 meses para la temperatura, y a 13 para los usuarios. A diferencia del
segundo caso, en el ltimo la informacin de un mes afecta directamente al resto de meses
del mismo grupo de 12; es decir, si bien es cierto que se puede predecir el nmero de
usuarios para dentro de un ao, lo que ocurra en los meses venideros puede afectar esta
previsin; por tanto interesa incorporar los datos disponibles lo ms rpidamente posible al
modelo, para una mayor fiabilidad de las previsiones.
El ltimo de los correlogramas es el de los usuarios de un telfono de atencin al cliente,
(tabla 4.V y figura 4.7). Adems de confirmar la estacionalidad de perodo 5, pone de
manifiesto que es aceptable hacer previsiones para los prximos 10 das, es decir, a dos
semanas vista.
Los autores, 2001; Edicions UPC, 2001.
p64 Series temporales
IBEX DEPORTE
-1
-0,5
0
0,5
1
k
r
k
-1,0
-0,5
0,0
0,5
1,0
k
r
k
TEMPERATURAS USUARIOS TRANSPORTE
-1
-0,5
0
0,5
1
k
r
k
-1,0
-0,5
0,0
0,5
1,0
k
r
k
USUARIOS TELFONO
-1
-0,5
0
0,5
1
k
r
k
Fig. 5.3.- Correlogramas
Los autores, 2001; Edicions UPC, 2001.
Otras tcnicas de previsin: ponderacin exponencial p65
6 OTRAS TCNICAS DE PREVISIN: PONDERACIN EXPONENCIAL
Cuando la serie presenta componente estacional y tendencia que se mantienen de forma
sostenida a lo largo de todo el perodo de recogida de datos, se han expuesto dos formas de
modelizarla y poder hacer previsiones: la descomposicin clsica y las variables
categricas.
Sin embargo, son frecuentes las situaciones en que la tendencia, caso de existir, puede ser
difcil modelizarla a travs de un simple modelo polinmico de menor o mayor grado. Podra
entonces pensarse en un modelo de evolucin que cambiase a lo largo del tiempo; en estos
casos las tcnicas asociadas a la metodologa de la ponderacin exponencial son tiles para
hacer previsiones sobre la evolucin futura.
6.1 Suavizado exponencial
La ponderacin exponencial, o suavizado exponencial, es otra tcnica destinada tambin a
estabilizar la serie, eliminando en lo posible la influencia del componente aleatorio. Para ello
se construye una nueva serie, la serie suavizada
t
S , a partir de los datos iniciales,
t
Y , de
manera que
t t t 1
S Y ( 1 ) S
= + + + + +
+ +
@
@
El valor de S
t
es la previsin para el tiempo siguiente, es decir,
t 1 t
Y S
+
=
#
.
El anlisis de la expresin anterior permite interpretar este tipo de suavizado, de forma que
el valor de Y previsto para el perodo t+1, es decir S
t
, se obtenga como promedio ponderado
de los valores reales que ha presentado la serie cronolgica desde el inicio de la recogida
de informacin. La discrepancia entre los valores obtenidos y los previstos, Y
t+1
S
t
, es
atribuible en parte al componente aleatorio y, posiblemente, a cambios bruscos en el
comportamiento de la serie.
El coeficiente de ponderacin juega el siguiente papel: cuanto mayor sea su valor, tanto
ms peso se dar a los valores recientes, en detrimento de los antiguos; mientras que
valores de prximos a cero dan gran peso a la historia y poca importancia a los valores
prximos.
Los autores, 2001; Edicions UPC, 2001.
p66 Series temporales
As, si la serie se mantiene estable, sern interesantes valores pequeos del coeficiente de
ponderacin ya que amortiguarn fuertemente la oscilacin aleatoria, mientras que si la
serie presentara cambios bruscos, la serie suavizada tardara mucho en detectarlos si su
fuese pequea, mientras que respondera prontamente a ellos con valores altos del
coeficiente .
Analizando la expresin del valor suavizado, para distintos valores de , se puede escribir,
por ejemplo,
= 0,10 Y
#
5
= S
4
= 0,10 Y
4
+ 0,09 Y
3
+ 0,081 Y
2
+ 0,729 Y
1
= 0,50 Y
#
5
= S
4
= 0,50 Y
4
+ 0,25 Y
3
+ 0,125 Y
2
+ 0,125 Y
1
= 0,90 Y
#
5
= S
4
= 0,90 Y
4
+ 0,09 Y
3
+ 0,009 Y
2
+ 0,001 Y
1
Es decir, con un valor del factor de ponderacin de 0,10, la previsin para t = 5 est
constituida por un 10% del valor observado en t = 4, un 9% del de t = 3, un 8,1% del de t = 2
y un 72,9 % del de t = 1; o sea, con un valor pequeo de , la previsin est constituida
mayoritariamente por el valor ms antiguo.
Cuando es igual a 0,50, los pesos aplicados a cada valor recogido estn ms
uniformemente repartidos y, cuando es grande, por ejemplo 0,90, el mayor componente de
la previsin es el ltimo valor observado; los dems tendrn un valor de ponderacin tanto
ms pequeo cuanto ms alejados estn en el tiempo.
El suavizado exponencial puede verse como un mtodo alternativo a las medias mviles,
con sus ventajas e inconvenientes.
Entre las primeras hay que citar que con la ponderacin exponencial no se pierde ninguna
informacin, al contrario que con las medias mviles, pues cuanto mayor era la longitud del
perodo a promediar, tanta ms informacin se perda, en el inicio y en el fin de la serie.
Adems una serie con cambios de tendencia, ms o menos bruscos, se puede modelizar
por suavizado exponencial y no podra hacerse ni por descomposicin ni por variables
categricas. Por el contrario, si la serie presenta estacionalidad con las medias mviles,
siempre que se escoja correctamente el perodo, sta desaparece totalmente y da lugar a
una serie estabilizada que permite modelizar directamente la tendencia, hecho que no
ocurre con la ponderacin exponencial simple, que no es capaz de suavizar la oscilacin
debida a la estacionalidad.
Para solucionar este inconveniente, se han desarrollado tcnicas basadas en el suavizado
exponencial, que permiten incorporar un modelo de tendencia o bien una componente
estacionaria; stas son las tcnicas de Brown, para el primer caso, o de Winters para el
segundo.
Los autores, 2001; Edicions UPC, 2001.
Otras tcnicas de previsin: ponderacin exponencial p67
6.2 Seleccin del factor de ponderacin
Tal como se ha expuesto, en funcin del valor de , se puede dar mayor o menor peso a la
historia, y detectar con ms o menos rapidez cambios bruscos en la serie; es por ello que la
seleccin del valor ms adecuado para el factor de ponderacin es crucial en el xito de la
modelizacin de la serie y la previsin de valores futuros.
Todos los mtodos utilizados para esta seleccin se basan en minimizar alguna funcin de
los errores de ponderacin.
Recordando que
t t 1
Y S
=
%
, los errores ms destacables son:
n Error medio: promedio de los errores de previsin; atendiendo a que para hacer
previsiones hay que disponer de datos, el primer valor previsto posible ser el de t = 2:
n
t t
t=2
( - )
S Y
M E =
n - 1
n Error absoluto medio: promedio de los valores absolutos de los errores de previsin:
n
t t
t=2
-
S Y
M A E =
n - 1
n Media del porcentaje del error: promedio de los porcentajes de los errores relativos de
previsin:
n
t t
t=2 t
Y Y
100
Y
M P E =
n - 1
%
n Media del porcentaje de error absoluto: promedio de los porcentajes de los valores
absolutos de los errores de previsin relativos:
n
t t
t t=2
-
Y Y
x 100
Y
M A P E =
n - 1
%
Hay que insistir en que en una serie en la que el tiempo es t = 1, 2,..., n, el suavizado
exponencial no ofrece ninguna previsin para t = 1, y, por tanto, no existe error de previsin
Los autores, 2001; Edicions UPC, 2001.
p68 Series temporales
en este punto; consecuentemente, en este caso los errores siempre son promedios de n 1
valores.
De los errores expuestos, aquellos que no toman valor absoluto, ME y MPE, tienen poco
inters ya que, a causa de la compensacin de valores positivos y negativos, pueden dar
valores de los promedios muy prximos a cero aun cuando existan errores de previsin muy
grandes. En general, se selecciona aquel valor de para el cual los valores del error
absoluto medio y del cuadrtico medio, MAE y MSE, alcancen los valores ms bajos.
Como ejemplo consideremos los datos de la tabla 6.I, serie cronolgica de 50 valores, cuya
representacin grfica puede verse en la figura 6.1.
t Y
t
t Y
t
t Y
t
t Y
t
t Y
t
1
2
3
4
5
6
7
8
9
10
9,958
10,096
11,552
9,113
13,898
11,487
11,114
9,505
17,934
12,339
11
12
13
14
15
16
17
18
19
20
16,510
12,674
17,504
13,462
16,945
18,653
18,942
15,084
16,568
20,733
21
22
23
24
25
26
27
28
29
30
26,267
20,401
18,748
20,800
21,683
27,069
23,728
24,890
26,132
24,663
31
32
33
34
35
36
37
38
39
40
25,217
24,653
28,062
27,317
26,122
29,837
28,854
27,129
30,194
34,104
41
42
43
44
45
46
47
48
49
50
28,448
35,726
30,602
31,011
31,732
31,538
32,175
35,543
35,534
37,336
Tabla 6.I.- 50 valores de una serie cronolgica
0
10
20
30
40
0 10 20 30 40 50 t
Y
Fig. 6.1.- Evolucin cronolgica de los datos de la tabla 6.I
Los autores, 2001; Edicions UPC, 2001.
Otras tcnicas de previsin: ponderacin exponencial p69
Observando el grfico, difcilmente se aprecia una estacionalidad, mientras que es evidente
una tendencia creciente y casi seguramente lineal. La figura 6.2 es el correlograma de la
serie que pone de manifiesto la ausencia de estacionalidad, junto con una autocorrelacin
significativa hasta un retardo de 4 unidades de tiempo.
-1,0
-0,5
0,0
0,5
1,0
k
r
k
Fig. 6.2.- Correlograma de la serie de la tabla 6.I
Aplicando la ponderacin exponencial a estos datos, en funcin del valor de , los errores
evolucionan segn muestra la tabla 6.II.
ME MSE MAE MPE MAPE
0,100 4,278 25,408 4,363 17,577 18,494
0,150 3,092 15,628 3,196 12,719 13,812
0,200 2,416 11,731 2,627 9,817 11,622
0,250 1,984 9,904 2,351 7,896 10,632
0,300 1,685 8,975 2,217 6,531 10,214
0,350 1,467 8,496 2,174 5,510 10,157
0,400 1,300 8,270 2,171 4,716 10,271
0,450 1,169 8,200 2,183 4,079 10,449
0,500 1,062 8,233 2,214 3,556 10,696
0,550 0,974 8,341 2,251 3,119 10,960
0,600 0,899 8,507 2,289 2,746 11,233
0,650 0,835 8,722 2,330 2,425 11,508
0,700 0,780 8,981 2,371 2,145 11,786
0,750 0,731 9,283 2,418 1,898 12,082
0,800 0,689 9,628 2,470 1,677 12,396
0,850 0,651 10,019 2,525 1,479 12,723
0,900 0,617 10,461 2,581 1,299 13,052
0,950 0,586 10,961 2,643 1,133 13,406
Tabla 6.II.- Evolucin de los errores en funcin de .
Los autores, 2001; Edicions UPC, 2001.
p70 Series temporales
Analizando detenidamente la evolucin de errores mostrada en la citada tabla, se observa
que, tanto el error medio (ME) como la media del porcentaje del error (MPE) disminuyen al
aumentar , mientras que los otros errores (MSE, MAE y MAPE) alcanzan el mnimo para
el intervalo 0,35 0,45. Dado que el error cuadrtico medio (MSE) es el que, en
general, presenta mejores propiedades, se va a tener en cuenta para seleccionar
definitivamente el coeficiente de ponderacin; as, en el caso del ejemplo, se va a trabajar
con = 0,45.
Para entender mejor lo que representa la seleccin de uno u otro valor de , en la figura 6.3
se pueden comparar las evoluciones de las series ponderadas respecto a los datos
cronolgicos para distintos valores del parmetro de ponderacin.
=0,10 =0,30
0
10
20
30
40
0 10 20 30 40 50 60 t
0
10
20
30
40
0 10 20 30 40 50 60 t
=0,45 =0,95
0
10
20
30
40
0 10 20 30 40 50 60
t
0
10
20
30
40
0 10 20 30 40 50 60
t
Fig. 6.3.- Serie original () y suavizada ( ) para distintas .
Directamente se observa que, en este caso, para valores pequeos de la serie suavizada
va por detrs de la real, es decir, tarda mucho en responder a la evolucin. Sin embargo,
cuando = 0,95, la suavizada est totalmente ligada a la oscilacin aleatoria de la serie, es
decir, la previsin para el tiempo inmediato siguiente es prcticamente igual al ltimo valor
medido. Cuando = 0,45, valor para el que ha resultado un error cuadrtico medio mnimo,
la serie suavizada exponencialmente, sigue ms claramente el esqueleto de la serie
cronolgica y queda amortiguada la oscilacin aleatoria.
Los autores, 2001; Edicions UPC, 2001.
Otras tcnicas de previsin: ponderacin exponencial p71
La figura 6.4 muestra los residuos, R
t
= Y
t
t
Y
#
= Y
t
S
t-1
, para tres valores de . En ella se
observa que para = 0,10 la mayora de los residuos son positivos, es decir, la previsin va
por detrs del valor real, mientras que para = 0,45 estn, casi siempre, entre los de =
0,10 y los de = 0,90, es decir, son ms prximos a cero, y por tanto, ms pequeos.
-6
0
6
12
0 10 20 30 40 50 t
R
Fig. 6.4.- Residuos en funcin de . = 0,10 (
) = 0,45 ( ) = 0,90 (
)
Para el valor del coeficiente de ponderacin seleccionado ( = 0,45), se calculan los valores
de la serie suavizada, (S
t
= 0,45 Y
t
+ 0,55 S
t-1
), las previsiones (
t
Y
#
= S
t-1
) y los residuos
(R
t
=Y
t
t
Y
#
), cuyos valores se muestran parcialmente en la tabla 6.III. En dicha tabla figuran
tambin los valores previstos para los tiempos 51, 52 y 53, de los que ya no se dispone de
datos.
La previsin para cualquier valor de t = 51, se ha calculado como
50 50 49 51
= = + ( 1- ) = 0,45 x 37,3364 + 0,55 x 34,4142 = 35,7292
S S Y
Y
La estimacin para cualquier otro valor de t superior a ste, se tendr que hacer tomando
como Y
t
el valor de la previsin, ya que no se dispone de datos reales. As
50 50 49 51
= = + ( 1- ) = 0,45 x 37,3364 + 0,55 x 34,4142 = 35,7292
S S Y
Y
es decir, con este sistema la previsin es idntica para cualquier tiempo futuro, tal como se
aprecia en las ltimas filas de la tabla 6.III. Ello evidencia que la previsin no concuerda con
la evolucin cronolgica presente (figura 6.5), aunque dentro del perodo estudiado la serie
suavizada sigue de forma muy razonable a los datos disponibles.
Los autores, 2001; Edicions UPC, 2001.
p72 Series temporales
t Y
t
S
t t
Y
#
R
t
1
2
3
48
49
50
9,958
10,096
11,552
35,543
35,534
37,336
9,958
10,020
10,709
33,498
34,414
35,729
9,958
10,020
31,825
33,498
34,414
0,138
1,532
3,718
2,036
2,922
51
52
53
35,729
35,729
35,729
35,729
35,729
35,729
=
+
y sustituyendo en ella Y
t-i
por su expresin de tendencia, Y
t-i
= a + b (ti), se obtiene
[ ]
t 1
i t
t 0
i 0
t 1 t 1
i i t
0
i 0 i 0
S = (1 ) a b(t i) (1 ) S
(a bt) (1 ) b i (1 ) (1 ) S
=
= =
+ + =
= + +
Considerando que se dispone de suficiente informacin como para considerar que t es
grande, la convergencia de las series anteriores es tal que
t 1
i
i 0
1
(1 )
t 1
i
2
i 0
1
i (1 )
y 0 ) 1 (
t
En consecuencia,
t t
2
1 1
S (a bt) b Y b
= + =
%
Se observa que la serie ponderada de unos datos cronolgicos con tendencia lineal es una
recta paralela a los datos con un desplazamiento igual a
1-
b
.
Anlogamente, la serie resultante de volver a suavizar S
t
, ser
(2) (2)
t t t 1
S S (1 ) S
= +
que, por desarrollo anlogo con el del primer suavizado, se puede expresar como
(2)
t t t
1 1
S S b Y 2 b
= =
%
Restando las expresiones de
(2)
t t
S y S se obtiene la estimacin, asociada al instante t, de
la pendiente de la recta que ajusta la tendencia:
( )
(2)
t t t
b S S
1
=
Si se dispone del valor de la serie para el tiempo t, se puede calcular la pendiente estimada
en ese instante, es decir,
t
b , es decir,
t T t t
Y Y b T
+
= +
% %
.
En la ecuacin anterior
t
Y
%
hace las veces de ordenada cuando se toma como origen del
tiempo el valor t, es decir, equivale a
t
a .
Los autores, 2001; Edicions UPC, 2001.
p74 Series temporales
A partir de esta consideracin y de las expresiones del primer y segundo suavizado, se
puede escribir
(2)
t t t t t t
1 1
2S S 2 Y b Y 2 b Y a
= = =
# # #
Como consecuencia, a partir de los datos disponibles hasta un cierto instante se puede
predecir el inmediato siguiente. De esta manera la serie cronolgica formada por las
previsiones (estimaciones) de Y, segn el modelo lineal suavizado, estar constituida por los
valores
t t 1 t 1 t 1 t 1
Y b 1 b
= + = +
#
y los residuos, o errores de ponderacin, se podrn evaluar como
t t t
R Y Y =
#
Cuando la ltima informacin disponible es la del tiempo t, y se desea hacer la previsin
para T unidades de tiempo a partir de este instante, suponiendo que se mantenga el mismo
comportamiento de la serie, la previsin ser
t T t t
Y a b T
+
= +
#
Como ejemplo, se va a aplicar esta metodologa a los datos de la tabla 6.I. Para ello hay que
dar valores a y, para cada valor de t, calcular
(2)
t t t t t t
S , S , a , b , Y y R
#
. La evolucin
de los errores en funcin de se muestra en la figura 6.6.
MSE MAE
0,10 7,164 1,995
0,15 6,563 2,004
0,20 6,848 2,094
0,30 7,979 2,266
0,40 9,466 2,443
0,50 11,325 2,683
0,60 13,684 2,956
0,70 16,752 3,258
0,80 20,879 3,577
0,90 26,643 4,047
0
10
20
30
0 0,2 0,4 0,6 0,8 1
MSE
Fig. 6.6.- Seleccin de con tendencia lineal
El factor de ponderacin seleccionado es = 0,15; con l la aplicacin del mtodo de Brown
conduce a las ponderaciones que numricamente se detallan, para los ltimos datos en la
tabla 6.IV.
Los autores, 2001; Edicions UPC, 2001.
Otras tcnicas de previsin: ponderacin exponencial p75
Las previsiones desde t = 51 hasta t = 55, (T = 1,..., 4), que son las aceptables segn indic
el correlograma de la figura 6.2, se obtienen a partir de la expresin de las previsiones, es
decir,
t T t t
Y a b T
+
= +
#
= 35,794 + 0,549 T
La evolucin grfica de las series suavizada y prevista se muestran en la figura 6.7, donde
se observa una muy buena concordancia entre los datos reales y los suavizados, y se
aprecia que la previsin sigue la tendencia marcada por la serie cronolgica real.
t Y
t
S
t
(2)
t
S
t
b
t
Y
#
...
48
49
50
...
35,543
35,534
37,336
...
31,216
31,864
32,685
...
28,526
29,027
29,576
...
33,906
34,701
35,794
...
0,475
0,501
0,549
...
33,278
34,381
35,202
Tabla 6.IV.- Ponderaciones con =0,15 y tendencia lineal
0
10
20
30
40
0 20 40 60
t
Fig. 6.7.- Suavizado exponencial de Brown () y previsin (1), con = 0,15
La figura 6.8 contiene los residuos del modelo, o sea
t t t
R Y Y =
#
, y da idea de la
buena concordancia entre los datos reales y el modelo resultante del suavizado exponencial
de Brown. Este hecho avala la veracidad de las previsiones siempre y cuando no se
modifique el patrn de comportamiento que rega durante el perodo de recogida de datos.
Los autores, 2001; Edicions UPC, 2001.
p76 Series temporales
-4
-2
0
2
4
6
8
t
R
Fig. 6.8.- Residuos
En el prximo captulo se expondrn otros casos prcticos de anlisis de series temporales
para efectuar su modelizacin y realizar las previsiones oportunas.
Los autores, 2001; Edicions UPC, 2001.
Otros ejemplos p77
7 OTROS EJEMPLOS
En este captulo se van a desarrollar algunos casos prcticos de aplicacin de las tcnicas
propuestas anteriormente.
7.1 Ventas de papel
La tabla 7.I contiene las ventas mensuales de papel de impresin, en cientos de francos.
(Forecasting. Methods and Applications.; Makridakis, Wheelwright, McGee; pgina 433.)
En todos los ejemplos desarrollados hasta ahora, se dispona de unos datos, se proceda a
su modelizacin y a hacer previsiones, pero en ningn caso se han podido contrastar dichas
previsiones. De los 120 valores disponibles en el presente ejemplo se van a hacer dos
grupos, los 108 primeros, 9 aos, sern utilizados para modelizar la serie y hacer
previsiones y los ltimos 12 datos, un ao, se utilizarn para validar las previsiones
efectuadas
t Y t Y t Y t Y t Y
1 562,674 25 646,783 49 747,636 73 843,038 97 895,217
2 599,000 26 658,442 50 773,392 74 847,000 98 856,075
3 668,516 27 712,906 51 813,788 75 941,952 99 893,268
4 597,798 28 687,714 52 766,713 76 804,309 100 875,000
5 579,889 29 723,916 53 728,875 77 840,307 101 835,088
6 668,233 30 707,183 54 749,197 78 871,528 102 934,595
7 499,232 31 629,000 55 680,954 79 656,330 103 832,500
8 215,187 32 237,530 56 241,424 80 370,508 104 300,000
9 555,813 33 613,296 57 680,234 81 742,000 105 791,443
10 586,935 34 730,444 58 708,326 82 847,152 106 900,000
11 546,136 35 734,925 59 694,238 83 731,675 107 781,729
12 571,111 36 651,812 60 772,071 84 898,527 108 880,000
13 634,712 37 676,155 61 795,337 85 778,139 109 875,024
14 639,283 38 748,183 62 788,421 86 856,075 110 992,968
15 712,182 39 810,681 63 889,968 87 938,833 111 976,804
16 621,557 40 729,363 64 797,393 88 813,023 112 968,697
17 621,000 41 701,108 65 751,000 89 783,417 113 871,675
18 675,989 42 790,079 66 821,255 90 828,110 114 1006,852
19 501,322 43 594,621 67 691,605 91 657,311 115 832,037
20 220,286 44 230,716 68 290,655 92 310,032 116 345,587
21 560,727 45 617,189 69 727,147 93 780,000 117 849,528
22 602,530 46 691,389 70 868,355 94 860,000 118 913,871
23 626,379 47 701,067 71 812,390 95 780,000 119 868,746
24 605,508 48 705,777 72 799,556 96 807,993 120 993,733
Tabla 7.I.- Ventas mensuales de papel
Las figuras 7.1 y 7.2 muestran, respectivamente, la evolucin cronolgica de los datos y el
correlograma. De ellas se deduce la existencia de una estacionalidad de perodo 12,
naturalmente ligada a la evolucin mensual de los datos, y una tendencia creciente en los
primeros aos y ms estables en los ltimos; esto hace pensar en la posibilidad de un
Los autores, 2001; Edicions UPC, 2001.
p78 Series temporales
modelo parablico. Las previsiones, segn el correlograma, son aceptables a tres aos
vista.
0
200
400
600
800
1000
0 24 48 72 96 120 t
Y
Fig. 7.1.- Evolucin cronolgica de los datos de los primeros 9 aos
-1
-0,5
0
0,5
1
k
Fig. 7.2.- Correlograma
Dada la generalidad del mtodo, para tratar modelos aditivos, multiplicativos o mixtos, se
optar por la modelizacin con variables categricas.
Inicialmente se plantea el modelo que incluye el trmino lineal y el cuadrtico del tiempo, las
11 variables categricas y su conjuncin con el tiempo, es decir:
Y =
0
+
1
t +
2
t
2
+
2
Q
2
+
3
Q
3
+
4
Q
4
+
5
Q
5
+
6
Q
6
+
7
Q
7
+
8
Q
8
+
9
Q
9
+
10
Q
10
+
11
Q
11
+
12
Q
12
+
2
Q
2
t +
3
Q
3
t +
4
Q
4
t +
5
Q
5
t
+
6
Q
6
t +
7
Q
7
t +
8
Q
8
t +
9
Q
9
t +
10
Q
10
t +
11
Q
11
t +
12
Q
12
t +
Los autores, 2001; Edicions UPC, 2001.
Otros ejemplos p79
Despus de eliminar todos los trminos no significativos, el modelo definitivamente ajustado
se presenta en la tabla 7.II donde es destacable el buen ajuste (R
2
= 95,59%) obtenido.
El modelo definitivo es
(70
r s
donde
N k
i i k
i 1
k
(Y Y ) (Y Y )
+
=
=
y
N
2
i
i 1
0
(Y Y)
N
=
=
+
Hacer J9 = 1/72
J10 = (1+2*SUMA(I$9:I9))/72
y arrastrar hasta J26 donde habr la expresin =(1+2*SUMA(I$9:I25))/72. Los extremos del
intervalo de no significacin, 2S(r_k), estarn en las columnas K y L.
K9 = 2*RAIZ(J9)
L9 = 2*RAIZ(J9)
Arrastrar estas expresiones hasta K26 y L26. La tabla completa de resultados est en las
pginas 120 y 121.
2.3 Autocorrelograma
El grfico se obtiene seleccionando F9 F26, H9 H26, K9 K26 y L9 L26.
Con el icono de grficos
Asistente para Grficos
XY (Dispersin)
(3; 1), Dispersin con puntos conectados por lneas
Siguiente
Paso 1: Siguiente
Los autores, 2001; Edicions UPC, 2001.
Prctica 2. Autocorrelacin y correlograma p119
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo Autocorrelograma, quitar la leyenda y
Siguiente
Paso 4: Situar el grfico con Objeto en la actual hoja Datos. Terminar
Situar el grfico en la posicin y el tamao deseado, y editarlo para que presente el aspecto
habitual de un correlograma.
Seleccionando un punto de la Serie 1, y haciendo clic con el botn derecho del ratn, sale el
cuadro de la figura 2.4. Seleccionar:
Tipo de grfico 6 Columnas Aceptar
Fig. 2.4
Igualmente, sobre un punto de la Serie 2, en la pantalla de la figura 2.4, hacer
Formato de serie de datos
Carpeta Tramas:
Z Lnea suavizada Marcador Ninguno
Repetir la misma operacin, una vez situados en un punto de la Serie 3.
Si es necesario, se pueden quitar decimales del eje de ordenadas; para eso tendremos que
situarnos sobre el Eje de valores, y entonces, con doble clic, o presionando el botn
derecho del ratn, seguir la secuencia
Formato de ejes
Carpeta Nmero Posiciones decimales
y para quitar los valores de k de dentro del grfico, en el Eje de categoras, eje de abscisas,
Formato de ejes
Carpeta Tramas Rtulos de marca de graduacin Ninguno
El resultado es el grfico de la pgina 121.
Comentarios: En el correlograma se confirma claramente la estacionalidad de perodo 6.
El coeficiente de autocorrelacin asociado a k=18 an es significativo, por eso se pueden
hacer previsiones para los prximos 18 das, o sea, 3 semanas de ventas.
Los autores, 2001; Edicions UPC, 2001.
p120 Series temporales
2.4 Resultados
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
A B C D E F G H I J K L
Seman Dia Y Y-Ybar gamma_0
1 lunes 3968 -1653,36 4003801
1 martes 4572 -1049,36
1 mircoles 3964 -1657,36
1 jueves 6326 704,639
1 viernes 9673 4051,64
1 sbado 8307 2685,64
2 lunes 3593 -2028,36 k gamma_k r_k r_k^2 V(r_k) - 2S(r_k) + 2S(r_k)
2 martes 5367 -254,361 1 1089260,8 0,2721 0,0740 0,0139 -0,2357 0,2357
2 mircoles 3763 -1858,36 2 -1528643 -0,3818 0,1458 0,0159 -0,2525 0,2525
2 jueves 6703 1081,64 3 -2302898 -0,5752 0,3308 0,0200 -0,2828 0,2828
2 viernes 9485 3863,64 4 -1654914 -0,4133 0,1708 0,0292 -0,3417 0,3417
2 sbado 8207 2585,64 5 873463,57 0,2182 0,0476 0,0339 -0,3684 0,3684
3 lunes 3717 -1904,36 6 3551137,5 0,8869 0,7867 0,0353 -0,3755 0,3755
3 martes 4712 -909,361 7 978459,2 0,2444 0,0597 0,0571 -0,4779 0,4779
3 mircoles 3538 -2083,36 8 -1429667 -0,3571 0,1275 0,0588 -0,4848 0,4848
3 jueves 5758 136,639 9 -2118164 -0,5290 0,2799 0,0623 -0,4992 0,4992
3 viernes 9112 3490,64 10 -1510880 -0,3774 0,1424 0,0701 -0,5294 0,5294
3 sbado 7501 1879,64 11 775336,95 0,1937 0,0375 0,0740 -0,5442 0,5442
4 lunes 3108 -2513,36 12 3213971,1 0,8027 0,6444 0,0751 -0,5480 0,5480
4 martes 4771 -850,361 13 902365,54 0,2254 0,0508 0,0930 -0,6098 0,6098
4 mircoles 3643 -1978,36 14 -1276624 -0,3189 0,1017 0,0944 -0,6144 0,6144
4 jueves 6616 994,639 15 -1892155 -0,4726 0,2233 0,0972 -0,6236 0,6236
4 viernes 8907 3285,64 16 -1373896 -0,3431 0,1178 0,1034 -0,6432 0,6432
4 sbado 7993 2371,64 17 700396,45 0,1749 0,0306 0,1067 -0,6533 0,6533
5 lunes 3618 -2003,36 18 2879249,8 0,7191 0,5171 0,1075 -0,6559 0,6559
5 martes 4427 -1194,36
5 mircoles 4314 -1307,36
5 jueves 5616 -5,36111
5 viernes 8778 3156,64
5 sbado 7322 1700,64
6 lunes 2899 -2722,36
6 martes 4918 -703,361
6 mircoles 4226 -1395,36
6 jueves 6025 403,639
6 viernes 8712 3090,64
6 sbado 7685 2063,64
7 lunes 3408 -2213,36
7 martes 4869 -752,361
7 mircoles 3589 -2032,36
7 jueves 5437 -184,361
7 viernes 8239 2617,64
7 sbado 7360 1738,64
8 lunes 2915 -2706,36
8 martes 4237 -1384,36
8 mircoles 3679 -1942,36
8 jueves 6060 438,639
8 viernes 8755 3133,64
8 sbado 7475 1853,64
9 lunes 2979 -2642,36
9 martes 3971 -1650,36
Hoja: Datos
Los autores, 2001; Edicions UPC, 2001.
Prctica 2. Autocorrelacin y correlograma p121
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
A B C D E F G H I J K L
9 mircoles 3291 -2330,36
9 jueves 5336 -285,361
9 viernes 8392 2770,64
9 sbado 6790 1168,64
10 lunes 3539 -2082,36
10 martes 4694 -927,361
10 mircoles 3120 -2501,36
10 jueves 6026 404,639
10 viernes 7792 2170,64
10 sbado 7294 1672,64
11 lunes 3254 -2367,36
11 martes 4725 -896,361
11 mircoles 3227 -2394,36
11 jueves 5588 -33,3611
11 viernes 8320 2698,64
11 sbado 6995 1373,64
12 lunes 3229 -2392,36
12 martes 4648 -973,361
12 mircoles 3450 -2171,36
12 jueves 5129 -492,361
12 viernes 8159 2537,64
12 sbado 6923 1301,64
Hoja: Datos (continuacin)
AUTOCORRELOGRAMA
-1,0
-0,5
0,0
0,5
1,0
Los autores, 2001; Edicions UPC, 2001.
p122 Series temporales
PRCTICA 3. MODELIZACIN DE UNA SERIE CON VARIABLES CATEGRICAS
OBJETIVO: Se dispone de la evolucin de un indicador econmico a lo largo de 62
trimestres. Tenemos que analizar los datos de esta serie cronolgica, estimar el modelo de
comportamiento con variables categricas, estudiar su ajuste y hacer las previsiones
pertinentes. Todo esto se realizar mediante la hoja de clculo Excel 97 de Microsoft.
3.1 Recuperacin de los datos
Desde Excel recuperar el archivo que contiene los datos objeto de la prctica, y que se
encuentran en el directorio habitual de la red. Por esto hemos de seguir la secuencia (figura
3.1):
Archivo 6 Abrir
Y ahora ir al directorio donde se encuentra el archivo Practica 3.xls, seleccionarlo y Abrir.
Fig. 3.1
Una vez tenemos el archivo abierto, observamos que consta de una hoja denominada Datos
donde figuran 2 columnas de 62 valores cada una, con la estructura mostrada parcialmente
en la figura 3.2. En cada columna hay 62 valores, es decir, se empieza en la fila 1 (con el
ttulo) y se acaba en la 63.
La columna A, llamada t, contiene valores de 1 a 62, correspondientes a los 62 intervalos de
tiempo (trimestres) en que se ha recogido la informacin, y la B, con el nombre de Y,
contiene los valores del indicador econmico que se est estudiando.
Fig. 3.2
Los autores, 2001; Edicions UPC, 2001.
Prctica 3. Modelizacin de una serie con variables categricas p123
3.2 Anlisis de la evolucin de la serie cronolgica
En primer lugar, hemos de analizar la evolucin de la serie, cosa que ya hemos hecho en la
prctica n1, pero es suficientemente rpido como para hacerlo de nuevo. Se selecciona
desde A1 hasta B63 (columnas t y Y) y se presiona el icono de grficos , o tambin,
en la barra de herramientas, Insertar y despus Grfico.
En el Asistente para Grficos (figura 3.3) hemos de seleccionar XY (Dispersin) y ahora
la opcin (3; 1), es decir, Dispersin con puntos de datos conectados con lneas y
Terminar.
Situar el grfico en el lugar que se desee, y editarlo segn convenga.
Fig. 3.3
El resultado es el primer grfico de la pgina 134 de esta prctica.
Parece detectarse una estacionalidad de perodo 4, hecho que debemos confirmar mediante
el correlograma. Este grfico ha sido el objetivo de la prctica 2; aplicando la metodologa
expuesta a los datos actuales resulta el correlograma mostrado en la pgina 132, donde se
puede ver, por una parte, la evidencia de una estacionalidad de perodo 4 y, por otra, que es
admisible hacer previsiones para cinco intervalos de tiempo.
Conclusiones: Se detecta una clara estacionalidad, de perodo p=4, y posiblemente una
tendencia creciente y cuadrtica. El modelo que se tendr que estudiar ser
Y =
0
+
1
t +
2
t
2
+
2
Q
2
+
3
Q
3
+
4
Q
4
+
5
Q
2
t +
6
Q
3
t +
7
Q
4
t +
Los autores, 2001; Edicions UPC, 2001.
p124 Series temporales
3.3 Modelizacin con variables categricas
Creacin de las variables
Para poder modelizar la serie, en primer lugar hemos de crear las variables categricas, o
indicatrices, teniendo en cuenta que, en el caso de la prctica, el perodo p es igual a 4.
Para ello, se preparan los ttulos de las columnas que contendrn los valores de las
variables categricas. Recordando que las representamos por Q y que sus ndices van
desde 2 hasta p (teora de series temporales), en las casillas C1, D1 y E1 escribiremos Q2,
Q3, y Q4, tal como muestra la figura 3.4.
A continuacin rellenaremos cada variable categrica con sus valores. Al ser el perodo igual
a 4, hay 4 combinaciones diferentes de ceros y unos, una para cada componente del
perodo, y sabiendo que Q
i
vale la unidad si el orden del tiempo asociado es igual a i, y vale
cero en cualquier otro caso, el conjunto de valores es el que se muestra en el bloque C2
E5, de la figura 3.4.
Una vez lleno el bloque anterior, slo hemos de seleccionarlo y con Cortar y Pegar, llenar
todas las casillas C ... E hasta la fila 63, o bien arrastrar el bloque presionando
simultneamente el Ctrl (pgina 130).
Adems, para estudiar el modelo, es necesario disponer de las columnas con los valores
tQ
2
, tQ
3
y tQ
4
, tiempo (t) y tiempo al cuadrado (t^2). Estos valores estn en las columnas F,
... J. Para llenar estas columnas, es ya evidente que lo que debemos hacer es definirlas
como
F2 = A2*C2, G2 = A2*D2, H2 = A2*E2, I2 =A2 y H2 = A2*A2.
Despus arrastrar hasta la fila 63. En la figura 3.4 se puede ver la estructura que toman
estas columnas, y en la pgina 130 todos los valores.
Es una exigencia de Excel que todas las columnas de los trminos que constituyen el
modelo hayan de ser consecutivas y contiguas.
Fig. 3.4
Los autores, 2001; Edicions UPC, 2001.
Prctica 3. Modelizacin de una serie con variables categricas p125
Obtencin del modelo
De acuerdo con la naturaleza de los datos hay que plantear el modelo
2
0 1 2 2 2 3 3 4 4 5 2 6 3 7 4
Y t t Q Q Q Q t Q t Q t = + + + + + + + +
Para estimar los coeficientes y estudiar su significacin, el procedimiento es:
Herramientas 6 66 6 Anlisis de datos 6 66 6 Regresin
En este momento aparece la pantalla de la figura 3.5, donde debemos rellenar los campos
siguientes
Rango Y de entrada: $B$1:$B$63 (los valores de Y)
Rango X de entrada: $C$1:$J$63 (los valores de los regresores)
Z Rtulos
n Rango de salida $A$125 (una casilla que est vaca)
Los resultados se pueden ver en la pgina 133, con el ttulo Primer paso
Conclusiones: El coeficiente del trmino Q2 no es significativo (su nivel de significacin es p
= 0,292 > 0,05). Debemos eliminarlo del modelo lineal y volver a estimar los coeficientes.
Fig. 3.5
Los autores, 2001; Edicions UPC, 2001.
p126 Series temporales
Para eliminar el trmino Q2 y rehacer la regresin, con la rutina Regresin de Excel, es
necesario que todos los trminos del modelo estn juntos; por tanto hemos de eliminar la
columna de Q2. Hacerlo as directamente podra ocasionar problemas y modificaciones en
otras columnas ligadas a sta. Para evitarlo recomendamos lo siguiente:
Seleccionar con el ratn desde B1 hasta J63, presionar el botn derecho y hacer
Copiar.
Situarse, por ejemplo, en la casilla S1 (fila a partir de la cual todo est vaco) y
desplegar el men Insertar (figura 3.6).
Fig. 3.6
Seleccionar Pegado especial y ahora Valores (figura 3.7)
Fig. 3.7
Los autores, 2001; Edicions UPC, 2001.
Prctica 3. Modelizacin de una serie con variables categricas p127
Ahora eliminar la columna asociada a Q2 (la T en el caso del ejemplo): para ello se
pincha sobre la letra T distintiva de la columna, que quedar enmarcada por una lnea
que parpadea; entonces se presiona el botn derecho y se selecciona Eliminar. De
esta manera las columnas siguientes avanzan un lugar y vuelven a estar todas juntas,
es decir, empiezan en la S (valores de Y) y acaban en la Z (valores de t^2)
Y ahora hay que proceder como antes:
Herramientas 6 66 6 Anlisis de datos 6 66 6 Regresin
modificando los campos siguientes:
Rango X de entrada: $S$1:$Z$63 (los nuevos regresores)
n Rango de salida $A$150 (una casilla que est vaca)
Los resultados se pueden ver en la pgina 133 con el ttulo Segundo paso
Conclusiones: El modelo definitivo es
1
C2
C3
= B2
= $A$40*B3+(1 $A$40)*C2 arrastrar hasta C32
S
1
(2)
= Y
1
S
t
(2)
= S
t
+ ( 1 - ) S
t
1
(2)
D2
D3
= B2
= $A$40*C3+(1 $A$40)*D2 arrastrar hasta D32
(2)
t t t
a 2S S =
E2 = 2*C2 D2 arrastrar hasta E32
(2)
t t
b (S S )
1
Fig. 4.4
Previsiones
Una vez escogida la de trabajo, se puede pasar a calcular los valores previstos para los
prximos tres das, segn se ha deducido del correlograma. Por eso prolongamos la
columna A con los tres nuevos valores del tiempo (A33 = 32; A34 =33; A35 = 34).
El valor previsto para el instante t + T (31+T, en el caso de la prctica) es
t T t t
Y a b T
+
= +
#
En la casilla I33, perteneciente a la columna I etiquetada como Y prevista, se deber
escribir la expresin
= E$32+F$32*(A33-A$32)
Los autores, 2001; Edicions UPC, 2001.
p140 Series temporales
y arrastrarla hasta I35. As acabamos de calcular los valores previstos para los prximos tres
das del ndice econmico estudiado. Todos los resultados se muestran en la pgina 141.
Anlisis de los grficos
Seguidamente, y como ya es habitual, se proceder a la obtencin del grfico de los valores
reales, los modelizados y los previstos, y del grfico de los errores.
Para ello se selecciona, presionando la tecla Ctrl, desde B1 hasta B32 (valores de Y), desde
G1 hasta G32 (valores de Y estimada) y desde I1 hasta I35 (valores de Y prevista), y se
presiona el icono de grficos , o tambin, en la barra de herramientas, Insertar y
despus Grfico.
En el Asistente para Grficos seleccionar
XY (Dispersin)
(3,1) Dispersin con puntos de datos conectados por lneas
Terminar
Situaremos el grfico como Objeto en la misma hoja, y lo editaremos en la posicin y el
tamao deseados. El resultado es el grfico de la pgina 142.
Para obtener el grfico de los errores se procede seleccionando desde H1 hasta H32
(valores de los errores) y exactamente igual que en el grfico anterior. El resultado es el
grfico de la pgina 143.
Conclusiones: Las previsiones siguen muy bien todos los datos, a lo largo del tiempo de
recogida de informacin. Los errores no muestran ninguna particularidad destacable.
Los autores, 2001; Edicions UPC, 2001.
Prctica 4. Modelizacin y previsiones por suavizado exponencial p141
4.4 Resultados
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
A B C D E F G H I
Tiempo Y S S(2) a^ b^ Y est Error Y prevista
1 9,51 9,51 9,51 9,51 0,00
2 7,71 8,70 9,15 8,25 -0,36 9,51 -1,800
3 6,39 7,66 8,48 6,84 -0,67 7,89 -1,500
4 6,67 7,21 7,91 6,52 -0,57 6,18 0,494
5 9,14 8,08 7,99 8,18 0,08 5,95 3,188
6 7,66 7,89 7,94 7,84 -0,04 8,25 -0,593
7 7,74 7,82 7,89 7,76 -0,05 7,80 -0,057
8 9,36 8,51 8,17 8,86 0,28 7,70 1,657
9 10,03 9,20 8,63 9,76 0,46 9,14 0,890
10 8,38 8,83 8,72 8,94 0,09 10,22 -1,842
11 7,12 8,06 8,42 7,70 -0,30 9,03 -1,906
12 9,06 8,51 8,46 8,56 0,04 7,40 1,661
13 9,6 9,00 8,70 9,30 0,24 8,60 1,004
14 11,44 10,10 9,33 10,86 0,63 9,54 1,901
15 10,93 10,47 9,85 11,10 0,51 11,49 -0,562
16 13,1 11,65 10,66 12,65 0,81 11,61 1,487
17 13,51 12,49 11,48 13,50 0,82 13,46 0,045
18 13,93 13,14 12,23 14,05 0,74 14,32 -0,390
19 13,54 13,32 12,72 13,92 0,49 14,79 -1,253
20 15,65 14,37 13,46 15,27 0,74 14,41 1,240
21 15,13 14,71 14,02 15,40 0,56 16,02 -0,887
22 17,06 15,77 14,81 16,73 0,79 15,96 1,099
23 19,03 17,24 15,90 18,57 1,09 17,51 1,517
24 21,38 19,10 17,34 20,86 1,44 19,66 1,717
25 22,82 20,77 18,89 22,66 1,55 22,30 0,519
26 22,76 21,67 20,14 23,20 1,25 24,21 -1,448
27 23,02 22,28 21,10 23,45 0,96 24,45 -1,430
28 23,62 22,88 21,90 23,86 0,80 24,41 -0,795
29 23,45 23,14 22,46 23,82 0,56 24,66 -1,212
30 24,57 23,78 23,05 24,51 0,60 24,37 0,197
31 24,17 23,96 23,46 24,45 0,41 25,11 -0,936
32 ECM = 1,822 24,86
33 25,27
34 25,67
0,45 Lambda E.C.M.
0,1 7,777
0,2 2,679
0,3 1,989
0,4 1,836
0,5 1,833
0,6 1,917
0,7 2,077
0,8 2,321
0,9 2,669
0,45 1,822
0
2
4
6
8
0 0,5 1
ECM
Hoja: Datos
Los autores, 2001; Edicions UPC, 2001.
p142 Series temporales
Evolucin cronolgica
0
10
20
30
0 10 20 30 40
Tiempo
Y
Valores medidos y previsiones
0
10
20
30
0 10 20 30 40
Tiempo
Y Y est Y prevista
Los autores, 2001; Edicions UPC, 2001.
Prctica 4. Modelizacin y previsiones por suavizado exponencial p143
Errores
-3
-2
-1
0
1
2
3
4
0 10 20 30 40
Tiempo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
A B C D E F G H I J K
Tiempo
Y Y - Ybar gamma_0
1 9,51 -4,602 37,975
2 7,71 -6,402
3 6,39 -7,722
4 6,67 -7,442
5 9,14 -4,972
6 7,66 -6,452
7 7,74 -6,372 k gamma_k r_k r_k^2 V(r_k) -2S(r_k) +2S(r_k)
8 9,36 -4,752 1 35,107 0,924 0,855 0,032 -0,359 0,359
9 10,03 -4,082 2 31,592 0,832 0,692 0,087 -0,591 0,591
10 8,38 -5,732 3 28,034 0,738 0,545 0,132 -0,727 0,727
11 7,12 -6,992 4 24,355 0,641 0,411 0,167 -0,818 0,818
12 9,06 -5,052 5 20,478 0,539 0,291 0,194 -0,880 0,880
13 9,6 -4,512 6 16,437 0,433 0,187 0,213 -0,922 0,922
14 11,44 -2,672 7 12,353 0,325 0,106 0,225 -0,948 0,948
15 10,93 -3,182 8 8,665 0,228 0,052 0,231 -0,962 0,962
16 13,1 -1,012 9 5,129 0,135 0,018 0,235 -0,969 0,969
17 13,51 -0,602 10 1,730 0,046 0,002 0,236 -0,972 0,972
18 13,93 -0,182
19 13,54 -0,572
20 15,65 1,538
21 15,13 1,018
22 17,06 2,948
23 19,03 4,918
24 21,38 7,268
25 22,82 8,708
26 22,76 8,648
27 23,02 8,908
28 23,62 9,508
29 23,45 9,338
30 24,57 10,458
31 24,17 10,058
Hoja: Correl
Los autores, 2001; Edicions UPC, 2001.
p144 Series temporales
Autocorrelograma
-1,0
-0,5
0,0
0,5
1,0
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p145
EVALUACIONES DE SERIES TEMPORALES
NDICE TEMTICO
1. DESCOMPOSICIN CLSICA
13.5.98................................................................... 1 2 3 4
3.5.99..................................................................... 1 2 3
23.6.99................................................................... 1 2 6
12.1.00................................................................... 1 2 3
17.5.00................................................................... 1 2 10
2. MODELIZACIN CON VARIABLES CATEGRICAS
13.5.98................................................................... 7 8 9
3.5.99..................................................................... 4 5 6
23.6.99................................................................... 3 4
12.1.00................................................................... 4 5
17.5.00................................................................... 3 4 5
3. AUTOCORRELACIN
13.5.98................................................................... 5 10
3.5.99..................................................................... 7
23.6.99................................................................... 7
12.1.00................................................................... 6 7
17.5.00................................................................... 6 7
4. SUAVIZADO EXPONENCIAL
13.5.98................................................................... 6
3.5.99..................................................................... 8 9 10
23.6.99................................................................... 5 8
12.1.00................................................................... 8 9
17.5.00................................................................... 8 9
Los autores, 2001; Edicions UPC, 2001.
p146 Series temporales
1 EVALUACIONES PROPUESTAS
Respuesta correcta +1; incorrecta 0,2
? 1. El modelo de tendencia ha sido T = 76,23 + 0,54 t 0,02 t
2
. Los respectivos niveles de
significacin de los trminos t y t
2
han sido 0,002 y 0,423. El modelo definitivo es
76,23+0,54t0,02t
2
76,23+0,54t Hay que recalcularlo ..
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p147
13.5.98
? 1 Los valores disponibles de una serie temporal son: 11,2; 13,4; 9,9; 11,9; 14,2; 11,0; 13,1; 14,8;
12,2; 14,1; 16,3; .... Se trata de un modelo:
multiplicativo tendencia rectilnea estacionalidad de p=2
aditivo tendencia parablica estacionalidad de p=3
. . . . . . . . . . ninguna tendencia estacionalidad de p=4
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
? 2 Por los datos anteriores, el valor de la tercera media mvil es:
11,75 12 12,15 13,36 . . . . . . . . . .
? 3 Los primeros datos de una serie multiplicativa p = 4 son: 32; 26; 22; 45; 52; 42; 29; ... El valor
de la media mvil asociada a t = 4 es:
31,25 36,25 38,25 40,25 . . . . . . . . . .
? 4 En una serie multiplicativa de p = 4,
* * * *
1 2 3 4
= 43.4 = 37.9 = 52.5 = 66.2
E E E E
; cul es el
valor de E
3
?
2.5 44.6 52.5 105 . . . . . . . . . .
? 5. Sobre 106 valores, la tendencia estimada es 254,9 + 0,25 t ; los ndices estacionales son E
1
=
35,5; E
2
= 72,8; E
3
= 60,7 y E
4
= 47,6 y el ltimo coeficiente de autocorrelacin significativo es
3
.
El valor ms alejado que se puede prever de la serie es:
317,65 282,15 221,45 194,95 . . . . . . . . .
? 6. Se dispone de los datos cronolgicos: Y
1
= 45,74; Y
2
= 47,95; Y
3
= 49,23; Y
4
= 51,47; ...
Para un valor = 0,8, cul es el cuarto valor de la serie suavizada (S
4
)?
48,89 51,37 41,18 50,95 . . . . . . . . . .
? 7. Un modelo aditivo de perodo 3, ha dado los siguientes ndices estacionales: E
1
= 10; E
2
= 20 y E
3
=
30. Los coeficientes
2
y
3
del modelo en variables categricas se estiman como:
20 y 30 10 y 40 25 y 45 10 y 10 . . . . . . . . . . .
? 8. La modelizacin de una serie aditiva con variables categricas ha dado
Y ) ?
63,790 56,614 51,956 40,220 ..................
? 10. Los valores de una serie son 67,38; 56,09; 75,11; 55,90 y 61,25 y los estimados segn el
modelo resultante del anlisis han sido 56,44; 62,29; 72,13; 59,60; y 65,45.Cul es el valor
del error cuadrtico medio (MSE)?
42,931 40,697 40,374 39,667 ...............................
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p149
23.6.99
????? Los primeros valores de una serie, de la que se dispone de 141 observaciones, son: 225;
219; 196; 197; 235; 208; 191; 212; 216; .... Se trata de un modelo aditivo con estacionalidad de
perodo 4. Por el sistema clsico se ha obtenido como tendencia T
t
= 200 + 0,10 t y como ndices
estacionales E
1
= 0,73; E
2
= 0,87 y E
3
= 0,4.
? 1. Cul es el valor de la primera media mvil?
207,500 208,250 208,375 209,625 210,500 ...............
? 2. Y cul el del residuo para t = 8?
12,20 12,30 12,32 12,40 12,42 ...............
? 3. Cules son los valores de les variables categricas asociadas a t = 10?
(0; 0; 0) (1; 0; 0) (0; 1; 0) (0; 0; 1) (1; 1; 1) ..............
? 4. Si se hubiese modelado con variables categricas, cul habra sido el valor de la
constante
0
?
200,63 200,65 200,73 200,75 200,83 ................
? 5. En una ponderacin exponencial simple ha resultado S
3
= 211,96. Cul es el valor de ?
2,63 3,20 3,30 4,50 5,43 ................
? 6. En la modelizacin de una serie multiplicativa de p = 3, se ha obtenido T
t
= 50 + 0,2 t + 0,1 t
2
; E
1
= 150; E
2
= 50 y para t=3 el residuo ha sido R
3
= 0,8. Cul es el valor de Y
3
?
72,10 61,80 55,75 46,35 52,30 ...............
? 7. Con los 50 valores de una serie se ha obtenido
50
2
i
i 1
(y y) 4
=
=
;
49
i i 1
i 1
(y y) (y y) 3,6
+
=
=
;
48
i i 2
i 1
(y y) (y y) 3,2
+
=
=
y
47
i i 3
i 1
(y y) (y y) 2,8
+
=
=
;
i
100
2
i 1
y 125
=
=
y
97
i i 3
i 1
y y 120
+
=
=
.
Qu vale r
3
?
faltan datos 0 0,80 0,96 1 .
? 7. En una serie con 80 datos se ha obtenido r
1
= 0,90; r
2
= 0,80; r
3
= 0,70; r
4
= 0,60. Cul es el
valor absoluto lmite de r
5
para ser considerado distinto de cero?
0,43 0,50 0,53 0,61 0,64 .
? 8. Los valores de una serie son 16,4; 16,9; 18,1; 18,5; 19,3; 19,8; en un suavizado exponencial
con = 0,6. Cul es el error de previsin para t = 4?
0,805 0,925 0,960 1,115 1,300 ....
? 9. En la misma serie del apartado anterior y con igual factor de ponderacin, cul sera el valor
estimado para t = 4 (
4
)
12 10,32 18 16,74 ...........................
? 4. Si el ltimo valor disponible es Y
106
= 250,27, qu vale el residuo de este punto?
9,77 30,27 5,73 2,23 ...........................
? 5. Cul es la previsin para t = 107?
232,88 250,69 230,61 224,46 ............................
?? Con 100 datos se ha obtenido
94
i i 6
i 1
(y y ) (y y )
+
=
= 483,22 y
100
2
i
i 1
(y y)
=
= 793,42
? 6. Qu vale r
6
?
hay un error 0,371 0,609 0,684 ............
? 7. Cul es el intervalo de no significacin para r
6
si r
1
= 0,95; r
2
= 0,32; r
3
= 0,84; r
4
= 0,60
y r
5
= 0,90?
0,464 0,179 0,520 1,323 ............
? 8. Se dispone de los valores 23,87; 15,22; 42,75; 54,23 y 50,80. En una ponderacin exponencial
simple con = 0,8, qu vale el error cuadrtico medio?
410,17 350,72 254,34 180,69 ...........................
? 9. En un suavizado exponencial por Brown, con = 0,7, sobre 50 datos, ha resultado Y
50
= 55,87;
S
50
= 49,32;
(2)
50
S = 47,54. Cul es la previsin para t = 52?
70,25 59,41 40,23 36,44 ...........................
? 10. En una serie multiplicativa de perodo p = 3, se ha obtenido
*
1
E = 15,25;
*
2
E = 30,50 y
*
3
E = 45,75. Cul es el valor del primer ndice estacional?
25 50 100 150 200 ............
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p123
2 EVALUACIONES RESUELTAS
Respuesta correcta +1; incorrecta 0,2
l 1. En un anlisis de componentes principales los valores propios, de la matriz de correlacio-
nes, son {2,78; 2; 0,16; 0,05; 0,01} y g
13
= 0,768. Qu vale r
13
?.
0,143 0,527 0,12 0,3072 n ..............................................
Puesto que d
i
= 5 es un valor entero, coincidente con el nmero de valores propios, necesa-
riamente se trabaja con variables estandarizadas y se ha diagonalizado la matriz de correla-
ciones. Entonces,
1 3 1 3 3
r g d 0,768 0,16 0,3072 = = =
L o s a u t o r e s , 2 0 0 1 ; E d i c i o n s U P C , 2 0 0 1 .
p124 Estadstica industrial
17.3.99
En una tabla de correspondencias la 3 columna es 13; 23; 17 y 20, y los totales de les colum-
nas son 100; 97; 73; 133 y 152.
l 1. Cuntos valores propios no triviales hay?
2 3 n 4 5 .........................................................................
Dado que hay p = 4 files y q = 5 columnas, resulta min (p1, q1) = 3.
l 2. Cul es la masa de la 2 columna?
0,314 0,240 0,175 n 0,711 ..............................................
Las masas de las columnas son
p
i j
j i 1
j
p
j
i 1
n
n
f
n
n
=
=
= =
= = =
= = =
l 4. Qu vale la masa total?
1 n 0,13 0,312 0,811 .....................................................
La masa total es, obviamente,
p q
i j
i 1 j 1
n
f f 1
n
= =
= = =
En un anlisis de componentes principales los valores propios de la matriz de correlaciones
son {2,78; 2; 0,16; 0,05; 0,01} y g
13
= 0,768.
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p125
l 5. De qu dimensin es el vector aleatorio?
4 5 n 6 7 .........................................................
La dimensin del vector aleatorio X, coincide con el nmero de valores propios. En este ca-
so p = 5.
l 6. Qu vale r
13
?.
0,143 0,527 0,12 0,3072 n ..............................................
Dado que d
i
= 5, un valor entero coincidente con el nombre de valores propios, necesaria-
mente se trabaja con variables estandardizadas y se ha diagonalizado la matriz de correlacio-
nes. Entonces
1 3 1 3 3
r g d 0,768 0,16 0,3072 = = =
l 7. Cuntos componentes principales se utilizaran?
1 2 n 3 4 ..............................................................
La proporcin acumulada que representan los valores propios (variancias de los componentes
principales) con relacin al total es: 2,78/5 = 0,556 (2,78 + 2)/5 = 0,956 etc. Entonces los
dos primeros ya son suficientes ya que explican el 95,6% del total.
l 8. Al estudiar los componentes principales ha resultado
t
g
1
= {0,48 0,32 0,47 0,48 0,46},
t
g
2
= {0,40 0,21 0,8 0,28 0,26} y Q = diag{4 9 6,25 7,75 8}. Qu vale
p
i
i 1
d
=
?
No se sabe 3,14 4 35 n .............................................
En las se indican Q = diag (s
1
2
s
2
2
. . . s
p
2
) y
p p
2
i i
i 1 i 1
d s
= =
=
resultando
p
i
i 1
d
=
= 35
Los autores, 2001; Edicions UPC, 2001.
p126 Estadstica industrial
19.4.99
En una tabla de correspondencias les 3 y 4 filas son {47; 65; 78; 35} y {82; 42; 76; 23};
Adems, las masas de las filas son {0,134; 0,268; 0,225; 0,223; 0,150}
l 1. Cul es la suma total, n?
225 223 777 1000 n ...............................................
Resulta
3
3
n
225
n 1000
f 0,225
= = =
l 2. Si la masa de la 3 columna es 0,232, qu vale X
33
?
1 0,2141 0,7197 n 0,0682 .............................................
Por definicin
33
3 3
3 3
f 0,078
X 0,7197
f f 0,225 0,232
= = =
Al estudiar los componentes principales ha resultado
t
g
1
= {0,47 0,32 0,48 0,46 0,48},
t
g
2
=
{0,40 0,28 0,8 0,21 0,26} y Q = diag{4 9 6,25 7,75 3,8}
l 3. Si r
12
= 0,632, qu vale d
2
?
22,14 36,48 25,78 9,99 n ..............................................
Las variancias, expuestas en la diagonal de la matriz Q, son razonablemente homogneas,
indicando que se ha diagonalizado la matriz S, y teniendo en cuenta que
12 2
12
1
g d
r
s
= resulta
2
2
12 1
2
2
12
r s 0,632 4
d 9,99
g 0,40
= = =
l 4. Si los dos primeros componentes expliquen un 95% de la variabilidad total, qu vale d
1
+d
2
?
27 32 64 25,65 n ......................................................
Dado que
p p
2
i i
i 1 i 1
d s
= =
=
= 27 y que
1 2
i
i
d d
0,95
d
+
=
resulta
d
1
+d
2
= 0,9527 = 25,65
l 5. Si la primera fila de la matriz R
XY
es (0,942 0,265 0,202 0,011 0,004), qu porcentaje
de la variabilidad de X
1
es explicado por los tres primeros componentes?.
1 0,5236 0,9984 n 0,9763 .......................................
La explicacin es
3
2 2 2 2
i j
j 1
r 0,942 0,265 0,202 0,9984
=
= + + =
L o s a u t o r e s , 2 0 0 1 ; E d i c i o n s U P C , 2 0 0 1 .
Evaluaciones p127
5.11.99
l 1. Habiendo diagonalizado la matriz de variancias-covariancias, qu vale
p
2
i 2
i 1
r
=
?
d
2
1 0,9 Es una funcin cuadrtica de g
i2
n ......
Si se ha diagonalizado la matriz variancias-covariancias
R
XY
= Q
-1/2
G D
1/2
segn aparece en la Pg. 6 de los apuntes, por lo que el producto escalar es
t
R
XY
R
XY
= D
1/2 t
G Q
1
G D
1/2
y siendo Q = diag ( S
1
2
. . . S
p
2
), resulta
2
p p
i 2 2
i 2 2
2
i 1 i 1 i
g
r d
S
= =
=
funcin cuadrtica de g
i2
.
l 2. Si U
23
=33, U
32
=44,
2 3
U 10, U 30 = = , S
2
=5, S
3
=10 y se estandariza, qu vale X
23
?
0,3 n 4,6 6,8 1,4 ....
2 3 3
2 3
3
U U
33 30
X 0,3
S 10
= = =
l 3. Si el mayor valor absoluto de la matriz de correlaciones es 0,307, qu procede?
Calcular los componentes principales Estandarizar Factorizar
Analizar las variables directas n .......................................
Si mx || = 0,307, las correlaciones entre las variables son muy reducidas, la informacin
redundante es prcticamente nula y se requerira un nmero muy elevado de componentes
para explicar razonablemente la variabilidad total. Por todo ello los componentes principales
son intiles.
Si D = diag(3,24 0,7 0,045 0,015) y G = 0,5
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1
l 4. Qu proporcin de X
3
es explicada por Y
2
?
17,5% n 92,3% 1,125% No se sabe ....
Puesto que la suma de los valores d
i
es 4, el orden de la matriz, se ha diagonalizado la matriz
de correlaciones y la proporcin de X
3
explicada por Y
2
es
r
32
2
= g
32
2
d
2
= (0,5)
2
0,7 = 0,175
Los autores, 2001; Edicions UPC, 2001.
p128 Estadstica industrial
l 5. Qu vale la correlacin experimental entre X
3
e Y
1
?
1,2 0,9 n 0,1061 3,4 ......
Teniendo en cuenta que la matriz D, de valores propios, as como la matriz G, de vectores
propios, son de orden 44, se trata de un anlisis de p=4 variables y como la suma de los va-
lores d
i
es cuatro, se ha diagonalizado la matriz de correlaciones y
r
31
= g
31
d
1
= (0,5) 3,24 = 0,9
l 6. El primer componente principal es
un factor de tamao un contraste n una media no se sabe ...........
Un contraste de X
1
y X
2
con X
3
y X
4
ya que los correspondientes coeficientes g
i1
cambian de
signo.
l 7. Cul es la variancia experimental de Y
5
?
No existe n 4 3 0,25 ...
Dado que las matrices D y G son de orden 44, slo hay cuatro variables y, por tanto, el n-
mero de Componentes Principales es, tambin, 4 y no existe Y
5
.
l 8 Cul es la medida relativa de la informacin compartida por dos variables?
La razn de medias la razn de variancias la covariancia la correlacin n
......................................................................................
La correlacin es la medida adimensional relativa de la informacin compartida (covariancia)
por dos variables aleatorias.
l 9 La homogeneidad entre modalidades de un criterio de clasificacin es medida por
los factores comunes el factor especfico
las correspondencias n la covariancia
.................................... .
Las correspondencias, comparando los perfiles mediante la distancia de
2
.
ATENCIN, MARCAR LA NICA RESPUESTA INCORRECTA
l 10 Los componentes principales:
reducen la masa de datos conservan la informacin
eliminan informacin redundante reducen el n de individuos n
reducen el nmero de variables
Reducen el nmero de individuos es incorrecto, ya que disminuyen el nmero de variables.
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p129
20.3.00
l 1. Una fila de una tabla de correspondencias es {13 26 39 22}, cul es el tercer elemento
de su perfil?
Falta n 0,39 n 39 1 ...............................
El tercer elemento de su perfil es
i3 i3 i3
i i ij
j
f n n 39
0,39
f n n 13 26 39 22
= = = =
+ + +
= 100, n
3
= 90 y n = 900, qu vale el elemento correspondiente de la ma-
triz Z para el estudio de las distancias de
2
entre las columnas?
0,99 0,95 0,05 0,8 n .............
El elemento de la matriz Z ser
13 13 13
1 3 1 3 1 3
f n / n n n 24 900
0,8
f f n / n (n / n) n n 100 90
= = = =
, si r
31
= 1, necesariamente todos los dems r
3j
, j > 1, han de ser
nulos.
Los autores, 2001; Edicions UPC, 2001.