Sei sulla pagina 1di 154

AULA POLITCNICA 64

Series temporales
AULA POLITCNICA / ETSEIT
Series temporales
Montserrat Pepi Vials
Primera edicin: septiembre 2001
Diseo de la cubierta: Manuel Andreu
Montserrat Pepi Vials, 2001
Edicions UPC, 2001
Edicions de la Universitat Politcnica de Catalunya, SL
Jordi Girona Salgado 31, 08034 Barcelona
Tel.: 934 016 883 Fax: 934 015 885
Edicions Virtuals: www.edicionsupc.es
E-mail: edicions-upc@upc.es
Produccin: Barcelona Digital, SL
Rossell 77, 08029 Barcelona
Depsito legal: B-29.192-2001
ISBN: 84-8301-526-9
Quedan rigurosamente prohibidas, sin la autorizacin escrita de los titulares del copyright, bajo las san-
ciones establecidas en las leyes, la reproduccin total o parcial de esta obra por cualquier medio o pro-
cedimiento, comprendidos la reprografa y el tratamiento informtico, y la distribucin de ejemplares de
ella mediante alquiler o prstamo pblicos.
ndice p9
NDICE
TEORA DE SERIES TEMPORALES
1 Introduccin
2 Anlisis de una serie temporal
2.1 Modelizacin por componentes ..............................................................................14
2.2 Enfoque Box Jenkins ...........................................................................................19
3 Descomposicin de una serie temporal
3.1 Medias mviles: tendencia......................................................................................24
3.2 Estacionalidad ........................................................................................................27
3.3 Caso temperaturas .................................................................................................31
3.4 Caso usuarios transporte pblico............................................................................37
4 Modelizacin con variables categricas
4.1 Comparacin del mtodo de descomposicin con el de variables categricas .......48
4.2 Caso usuarios de un telfono .................................................................................52
5 Autocorrelacin
5.1 Correlograma..........................................................................................................58
5.2 Interpretacin de los correlogramas........................................................................63
6 Otras tcnicas de previsin: ponderacin exponencial
6.1 Suavizado exponencial ...........................................................................................65
6.2 Seleccin del factor de ponderacin.......................................................................67
6.3 Mtodo de Brown ...................................................................................................72
7 Otros ejemplos
7.1 Ventas de papel......................................................................................................77
7.2 Generacin de electricidad .....................................................................................81
p10 Series temporales
PRCTICAS DE SERIES TEMPORALES CON EXCEL

Prctica1. Descomposicin clsica de una serie aditiva
1.1 Recuperacin de los datos .....................................................................................89
1.2 Anlisis de la evolucin de la serie cronolgica ......................................................90
1.3 Estabilizacin de la serie ........................................................................................94
1.4 Estacionalidad ........................................................................................................96
1.5 Estimacin de la tendencia...................................................................................100
1.6 Modelo y residuos ................................................................................................103
1.7 Previsiones...........................................................................................................105
1.8 Resultados ...........................................................................................................107
Prctica 2. Autocorrelacin y correlograma
2.1 Recuperacin de los datos ...................................................................................115
2.2 Clculo de los coeficientes de autocorrelacin .....................................................115
2.3 Autocorrelograma.................................................................................................118
2.4 Resultados ...........................................................................................................120
Prctica 3. Modelizacin de una serie con variables categricas
3.1 Recuperacin de los datos ...................................................................................122
3.2 Anlisis de la evolucin de la serie cronolgica ....................................................123
3.3 Modelizacin con variables categricas................................................................124
3.4 Estimaciones y residuos .......................................................................................127
3.5 Previsiones...........................................................................................................128
3.6 Resultados ...........................................................................................................130
Prctica 4. Modelizacin y previsiones por suavizado exponencial (Mtodo de Brown)
4.1 Recuperacin de los datos ...................................................................................136
4.2 Anlisis de la evolucin de la serie cronolgica ....................................................137
4.3 Mtodo de Brown .................................................................................................138
4.4 Resultados ...........................................................................................................141
EVALUACIONES DE SERIES TEMPORALES
1 Evaluaciones propuestas
1.1 13.5.98 .................................................................................................................147
1.2 3.5.99 ...................................................................................................................148
1.3 23.6.99 .................................................................................................................149
1.4 12.1.00 .................................................................................................................150
1.5 17.5.00 .................................................................................................................151

2 Evaluaciones resueltas
2.1 13.5.98 .................................................................................................................153
2.2 3.5.99 ...................................................................................................................156
2.3 23.6.99 .................................................................................................................159
2.4 12.1.00 .................................................................................................................161
2.5 17.5.00 ..............................................................................................................164
Series temporales p167
BIBLIOGRAFA BSICA
n Anderson, O.D., Time Series Analysis and Forecasting, (1977).
n Ardanuy, R., Martn, Q. , Estadstica para Ingenieros, Hesprides (1993).
n Chatfield, C., The Analysis of Time Series, Chapman & Hall (1996).
n Diebold, F.X., Elementos de pronsticos, International Thomson Editores (1998).
n Makridakis, S. , Wheelwright, S., McGee, V., Forecasting: Methods and Applications,
John Wiley (1983).
n Newbold, P., Estadstica para los negocios y la economa, Prentice Hall (1997).
Introduccin p11
TEORA DE SERIES TEMPORALES
1 INTRODUCCIN
Una serie temporal es un conjunto de observaciones ordenadas en el tiempo o, tambin, la
evolucin de un fenmeno o variable a lo largo de l. Esta variable puede ser econmica
(ventas de una empresa, consumo de cierto producto, evolucin de los tipos de inters,...),
fsica (evolucin del caudal de un ro, de la temperatura de una regin, etc.) o social (nmero
de habitantes de un pas, nmero de alumnos matriculados en ciertos estudios, votos a un
partido,...).
El objetivo del anlisis de una serie temporal, de la que se dispone de datos en perodos
regulares de tiempo, es el conocimiento de su patrn de comportamiento para prever la
evolucin futura, siempre bajo el supuesto de que las condiciones no cambiarn respecto a
las actuales y pasadas.
Si al conocer la evolucin de la serie en el pasado se pudiese predecir su comportamiento
futuro sin ningn tipo de error, estaramos frente a un fenmeno determinista cuyo estudio
no tendra ningn inters especial. Esto correspondera a una situacin como la de la figura
1.1, que muestra la intensidad de corriente, I, que circula a travs de una resistencia, R,
sometida a un voltaje sinusoidal, V(t) = a cos (vt + ); por tanto I(t) = a cos (vt + )/R.
-1,5
-1
-0,5
0
0,5
1
1,5
0 20 40 60 80 t
I(t)
Fig. 1.1.- Observaciones de la serie I(t) = cos (0,5t + /2)
En general, las series de inters llevan asociados fenmenos aleatorios, de forma que el
estudio de su comportamiento pasado slo permite acercarse a la estructura o modelo
probabilstico para la prediccin del futuro. Estos modelos se denominan tambin procesos
estocsticos. As, un proceso estocstico es una sucesin de variables aleatorias {Y
t
}, con
t = 1, 2, ..., n, que evolucionan con el tiempo ( representado ste por el subndice t).
Cuando se dispone de n datos de un proceso estocstico, se est frente a n muestras, de
tamao unidad, extradas de la poblacin (variable aleatoria), correspondientes al tiempo en
que se realiz la medicin, y esto es lo que constituye la serie temporal o cronolgica.
Como ejemplo puede servir la evolucin a lo largo de un ao del ndice IBEX35, que recoge
los 35 valores de mayor cotizacin de la bolsa espaola, representada en la figura 1.2.
Los autores, 2001; Edicions UPC, 2001.
p12 Series temporales
Lgicamente, el valor del IBEX35 depender del valor alcanzado en los das previos,
adems de recoger la influencia de un conjunto de factores sociales, polticos, econmicos,
etc., que son continuamente cambiantes en el tiempo y cuya conjuncin, en un determinado
instante, configurara una hipottica distribucin de probabilidad del citado ndice econmico.
En casos como ste, es evidente que puede obtenerse un modelo que explique el
comportamiento de la serie en el perodo estudiado, pero puede ser muy arriesgada la
utilizacin de este modelo para hacer previsiones a medio o largo plazo. As, en todas las
series cronolgicas, es necesaria una gran cautela en la previsin a causa de la muy
probable inestabilidad del modelo en un futuro ms o menos alejado del ltimo instante del
que se conocen datos.
3
3,5
4
4,5
5
enero diciembre
IBEX35
Fig. 1.2.- Evolucin del ndice IBEX35
Otro ejemplo puede ser el constituido por la sucesin de variables aleatorias {Y
1
, ...,Y
t
,...},
tales que
t t 1 t
Y 0,80Y

= + , con Y
0
= 0 y los
t
distribuidos N(0; 1), independientes para todo
t = 1, 2,...
Esta serie puede expresarse tambin como
t
t i
t i
i 1
Y 0,8

=
=

y la distribucin de
probabilidad de cualquier Y
t
corresponde a una ley Normal, con esperanza matemtica
t t
t i
t
i 1
1 0,8
E(Y) 0,8
0,2

= =

y variancia
t t
2(t i)
t
i 1
1 0,64
V(Y) 0,8
0,36

= =

.
La figura 1.3 muestra la ley de probabilidad de la variable Y en los instantes t = 1, t = 4 y t =
20, junto con la serie cronolgica compuesta por las 25 primeras observaciones de la
misma.
La particular forma de la informacin disponible de una serie cronolgica, n muestras de
tamao unidad procedentes de otras tantas poblaciones de distribucin y caractersticas
desconocidas, hacen que las tcnicas de inferencia estadstica, usualmente aplicadas en
muestras de tamao superior a la unidad, no sean vlidas para estos casos.
Los autores, 2001; Edicions UPC, 2001.
Introduccin p13
En los captulos siguientes se pretende presentar, de forma simple, distintos criterios
metodolgicos que permitan el estudio de estos fenmenos, y en particular la previsin de
su evolucin futura, para aplicarlos a campos tcnicos y econmicos, como por ejemplo
previsin de las ventas de una empresa, de los usuarios de un medio de transporte, de la
caracterstica de inters de un proceso continuo, etc.
Y
t
-10
-5
0
5
10
15
20
0 5 10 15 20 25
Fig. 1.3.- Distribucin de Y
t
y 25 observaciones de la serie
Todas las formas de estudio de una serie cronolgica, tal como se ir viendo, no conllevan
clculos complicados, pero s reiterativos, con gran volumen de datos manipulados y con
abundancia de grficos; es por ello que para su estudio se hace muy necesario el disponer
de un programa informtico que permita su correcta aplicacin y la obtencin de cuantos
grficos sean necesarios.
Los autores, 2001; Edicions UPC, 2001.
p14 Series temporales
2. ANLISIS DE UNA SERIE TEMPORAL
Antes de abordar cualquier estudio analtico de una serie temporal, se impone una
representacin grfica de la misma y la observacin detenida de su aspecto evolutivo.
Para estudiar el comportamiento de cualquier serie temporal, y predecir los valores que
puede tomar en un futuro, puede hablarse de distintas metodologas, que denominaremos
modelizacin por componentes y enfoque Box-Jenkins.
2.1 Modelizacion por componentes
Este mtodo consiste en identificar, en la serie Y
t
, cuatro componentes tericas, que no
tienen por qu existir todas, y que son:
Tendencia: T
t
.
Estacionalidad: E
t
.
Ciclos: C
t
.
Residuos: R
t
.
Cada una de estas componentes es una funcin del tiempo y el anlisis consistir en la
separacin y obtencin de cada una de ellas, as como en determinar de qu forma se
conjugan para dar lugar a la serie original. Estas componentes se pueden observar en la
figura 2.1, en donde se ha considerado que actan de forma aditiva para dar lugar a la serie
cronolgica.
La tendencia es la componente general a largo plazo y se suele expresar como una funcin
del tiempo de tipo polinmico o logartmico, por ejemplo T
t
=
0
+
1
t+
2
t
2
+
Las variaciones estacionales son oscilaciones que se producen, y repiten, en perodos de
tiempo cortos. Pueden estar asociadas a factores dinmicos, por ejemplo la ocupacin
hotelera, la venta de prendas de vestir, de juguetes, etc., cuya evolucin est claramente
ligada a la estacionalidad climtica, vacacional, publicitaria, etc.
Las variaciones cclicas se producen a largo plazo y suelen ir ligadas a etapas de
prosperidad o recesin econmica. Suelen ser tanto ms difciles de identificar cuanto ms
largo sea su perodo, debido, fundamentalmente, a que el tiempo de recogida de
informacin no aporta suficientes datos, por lo que a veces quedarn confundidas con las
otras componentes.
Los autores, 2001; Edicions UPC, 2001.
Anlisis de una serie temporal p15
TENDENCIA
ESTACIONALIDAD
CICLOS
RESIDUOS
100
125
150
175
200
-40
-20
0
20
40
-60
-30
0
30
60
-5
-3
0
3
5
0
100
200
300
SERIE
CRONOLGICA
Fig. 2.1.- Componentes de una serie cronolgica
La componente residual es la que recoge la aportacin aleatoria de cualquier fenmeno
sujeto al azar.
Los autores, 2001; Edicions UPC, 2001.
p16 Series temporales
Para evaluar las distintas componentes se utilizan tcnicas estadsticas tales como modelo
lineal, medias mviles, diferencias finitas, etc.
Admitiendo que el componente aleatorio (residuo) es aditivo, una vez identificadas las otras
componentes surge un nuevo problema que es el cmo conjuntar tendencia, estacionalidad
y ciclos para dar lugar a la serie definitiva.
As se proponen, entre otros, modelos genricamente denominados aditivos y
multiplicativos.
Modelo aditivo: Y = T + E + C + R
Modelo multiplicativo: Y = T x E x C + R
Para una primera identificacin visual del caso, se puede considerar que si el patrn
estacional se mantiene con amplitud constante se tratar de modelo aditivo (figuras 2.1 y
2.2). Cuando dicho patrn se vaya amplificando con el tiempo, ser multiplicativo (figura
2.3).
50
100
150
200
250
t
Y
Fig. 2.2.- Serie aditiva
0
100
200
300
400
t
Y
Fig. 2.3.- Serie multiplicativa
Los autores, 2001; Edicions UPC, 2001.
Anlisis de una serie temporal p17
Un modelo aditivo se puede interpretar como aquel en que la estacionalidad acta
modificando la ordenada en el origen de la tendencia.
Supongamos que no hay ciclos, que la tendencia es de tipo lineal, T
t
=
0
+
1
t, y que la
estacionalidad es de perodo p = 4, es decir, cada 4 unidades de tiempo se repite el patrn
(tal como ocurre en la figura 2.2). Representando sus valores por E
1
, E
2
, E
3
y E
4
,
respectivamente, el modelo aditivo se puede escribir como
Y
1
=
0
+
1
1 + E
1
+ R
1
=
1
+
1
1 + R
1
Y
2
=
0
+
1
2 + E
2
+ R
2
=
2
+
1
2 + R
2
Y
3
=
0
+
1
3 + E
3
+ R
3
=
3
+
1
3 + R
3
Y
4
=
0
+
1
4 + E
4
+ R
4
=
4
+
1
4 + R
4
Y
5
=
0
+
1
5 + E
1
+ R
5
=
1
+
1
5 + R
5
. .
Y
t
=
0
+
1
t + E
s
+ R
t
=
s
+
1
t + R
t
con t = p
$
+ s; s = 1, , p
As pues, cada estacin (s) componente del perodo conforma una recta con ordenada en el
origen distinta para cada caso y pendiente comn a todos; es decir, segn muestra la figura
2.4, el modelo es un conjunto de rectas paralelas, cada una de ellas asociada a una
estacin.
En el modelo multiplicativo, el componente estacional acta sobre la ordenada en el origen y
sobre la pendiente.
50
100
150
200
250
t
Y
Fig. 2.4.- Interpretacin de una serie con modelo aditivo
Prescindiendo de los ciclos, supuesta una tendencia lineal tipo T
t
=
0
+
1
t y una
estacionalidad de perodo p, para cualquier t = p
$
+ s, con s = 1, , p, resulta
Los autores, 2001; Edicions UPC, 2001.
p18 Series temporales
Y
t
= T
t
E
s
+ R
t
= (
0
+
1
t) E
s
+ R
t
,
es decir Y
t
= (
0
E
s
) + (
1
E
s
) t + R
t
o sea Y
t
=
0s
+
1s
t + R
t
De esta forma, cada una de las p estaciones del perodo configura una recta distinta, tanto
en lo que se refiere a la ordenada en el origen (
0s
) como a la pendiente (
1s
).
El conjunto de las p rectas constituye el modelo de comportamiento de la serie (figura 2.5).
Es evidente que esta divisin, en modelo estrictamente aditivo o estrictamente multiplicativo,
es bastante restrictiva, ya que puede darse el caso de que en algunas estaciones cambie
slo la pendiente, o slo la ordenada en el origen. Esto constituira un modelo mixto mucho
ms general que los propuestos hasta ahora, los cuales pasaran a ser meros casos
particulares de ste. En la figura 2.6 se presenta una situacin de este tipo.
0
100
200
300
400
500
t
Y
Fig. 2.5.- Interpretacin de una serie con modelo multiplicativo

0
50
100
150
200
t
Y
Fig. 2.6.- Modelo general
Los autores, 2001; Edicions UPC, 2001.
Anlisis de una serie temporal p19
2.2 Enfoque Box - Jenkins
La forma de encarar el anlisis de las series temporales a travs de la metodologa de Box-
Jenkins es dirigir el esfuerzo a determinar cul es el modelo probabilstico que rige el
comportamiento del fenmeno a lo largo del tiempo. Es decir, partiendo de la premisa de
que no siempre va a ser posible identificar los componentes de la serie, se trata de estudiar
el componente aleatorio puro, reflejado en los residuos.
La metodologa estadstica utilizada en el estudio de una serie temporal por este sistema, se
basa en los siguientes pasos:
Identificacin del modelo.
Estimacin de los parmetros.
Validacin de los supuestos admitidos en el anlisis, tambin llamado diagnosis del
modelo.
Para poder abordar esta metodologa es imprescindible, en primer lugar, estudiar un
conjunto de modelos de comportamiento que cubran el mayor espectro posible de los
procesos estocsticos objeto de nuestro inters. Entre ellos se pueden destacar los
procesos de ruido blanco, medias mviles (MA), autorregresivos (AR), integrados (I) y sus
conjunciones (ARMA y ARIMA). A partir de aqu se podr identificar la serie de datos con
alguno de los modelos estudiados, estimar sus parmetros y validar la admisibilidad del
modelo adoptado.
En general, se suele asumir que el componente aleatorio, el cual se representa por Z, sigue
una distribucin Normal de media cero y variancia
2
. Un proceso estocstico en que todos
sus componentes son independientes y estn constituidos slo por componente aleatorio se
denomina proceso de ruido blanco, es decir, Y
t
= Z
t
con Z
t
NINDEP(0;
2
) t.
Un proceso se denomina de media mvil de orden q, y se representa por MA(q), si su
estructura es del tipo Y
t
= Z
t
+
t-1
Z
t-1
+ +
t-q
Z
t-q
. En la figura 2.7 se muestra un MA(4).
-4
-3
-2
-1
0
1
2
3
4
t
Y
Fig. 2.7.- Proceso de media mvil MA(4)
Los autores, 2001; Edicions UPC, 2001.
p20 Series temporales
Un proceso es autorregresivo de orden p, y se representa por AR(p), cuando cada
componente es funcin de los anteriores ms el trmino aleatorio; su estructura corresponde
a
Y
t
= Z
t
+
t-1
Y
t-1
+ +
t-p
Y
t-p
En la figura 2.8 se muestra un AR(2).
Cuando a las estructuras de autorregresin y media mvil se une una dependencia con el
tiempo se llega a un ARIMA(p, r, q), donde p es el orden del AR, q el del MA y r el del
proceso integrado, o, lo que es lo mismo, el grado del polinomio que representa la funcin
del tiempo. En la figura 2.9 se presenta un proceso ARIMA(2,1,3).
-4
-3
-2
-1
0
1
2
3
4
t
Y
Fig. 2.8.- Proceso autorregresivo AR(2)
0
10
20
30
40
50
60
70
80
90
t
Y
Fig. 2.9.- Proceso ARIMA(2, 1, 3)
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p21
3 DESCOMPOSICIN DE UNA SERIE TEMPORAL
Este mtodo, tambin denominado sistema clsico, descompone la serie en tendencia,
estacionalidad, ciclos y residuos Una vez decidida la conjuncin entre ellos, aditiva o
multiplicativa, se obtiene el modelo con el que hacer previsiones.
La tendencia es la componente ms importante de la serie, al definir lo que se podra
interpretar como comportamiento a largo plazo. Cada observacin va ligada a un valor del
tiempo, lo que permite plantear un modelo del tipo
Y (t) = +
donde la funcin (t) puede ser:
lineal: (t) =
0
+
1
t
polinmica: (t) =
0
+
1
t +
2
t
2
+ ...
exponencial: (t) =
0
t

1

Si la serie no presenta estacionalidad, el mtodo de estimacin mnimo-cuadrtica y todas
las pruebas de hiptesis relativas a la explicacin del modelo y a la significacin de los
coeficientes estimados, propios del modelo lineal ordinario, permiten estimar los
coeficientes del modelo de tendencia sobre los datos directos.
Caso de existir componente estacional, para que sta no enmascare la tendencia, es
necesario estabilizar previamente la serie.
Para desarrollar la metodologa de la descomposicin clsica sobre un ejemplo, se dispone
de los datos relativos a las ventas de material deportivo en una gran superficie comercial,
recogidos en la tabla 3.I y representados en la figura 3.1. En esta tabla el tiempo (t) se ha
medido tomando como referencia el inicio del perodo de recogida de datos, y, en este caso,
su unidad es el trimestre.
La observacin de la figura 3.1, permite pensar en una tendencia lineal creciente y una
estacionalidad clara, cuyo patrn se repite anualmente, es decir, cada 4 valores del tiempo
(trimestres). Esto se puede interpretar como una tendencia sostenida de un aumento de las
ventas en esta superficie comercial, unida a un comportamiento distinto para cada uno de
los cuatro trimestres; debido, posiblemente, a que el precio del material deportivo es muy
distinto segn sea el adecuado para una estacin concreta (material de esqu frente a
entretenimiento de playa, por ejemplo). Por otra parte, el patrn estacional se mantiene con
una amplitud aproximadamente constante, lo que conduce a la utilizacin de un modelo
aditivo.
Los autores, 2001; Edicions UPC, 2001.
p22 Series temporales
Ao Trimestre Ventas (Y) t
1990 1
2
3
4
40,22
54,89
63,51
111,35
1
2
3
4
1991 1
2
3
4
46,95
51,62
61,47
108,58
5
6
7
8
1992 1
2
3
4
41,38
65,30
64,25
113,82
9
10
11
12
1993 1
2
3
4
53,34
59,37
66,15
121,5
13
14
15
16
1994 1
2
3
4
67,38
56,09
75,11
124,39
17
18
19
20
1995 1
2
3
4
55,90
61,25
75,44
126,50
21
22
23
24
Tabla 3.I.- Ventas de material deportivo
40
70
100
130
0 4 8 12 16 20 24 t
Y
Fig. 3.1.- Evolucin cronolgica de las ventas de material deportivo
En este ejemplo se ha identificado un patrn estacional compuesto por los cuatro trimestres
y que se repite de ao en ao, adems de una tendencia aparentemente lineal. Si se
decidiese ajustar el modelo de tendencia directamente sobre los datos, se obtendran los
resultados de la tabla 3.II.
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p23
nu S. C. C. M. F p-val
Regresin 1 1901,300 1901,300 2,677 0,116
Residuos 22 15623,686 710,168
Total 23 17524,985
Coef. Error tpico t p-val
Ord. Origen 57,501 11,229 5,121 0,000
t 1,286 0,786 1,636 0,116
R^2 = 0,10849
Tabla 3.II.- Modelo de tendencia ajustado sobre todos los datos: Y =
0
+
1
t +
El modelo presenta un coeficiente de determinacin (R^2) tan slo del 10,8% y no resulta
estadsticamente significativo, ya que el nivel de significacin (p-val), tanto del ajuste como
de la pendiente de la recta de tendencia, son claramente superiores a un riesgo de primera
especie del 5%. As, se demuestra que este procedimiento no es vlido ya que incluye en el
residuo todo el componente estacional, lo cual produce una inflacin de la suma de
cuadrados residual que desvirta el modelo y cualquier prueba de significacin de la
regresin y de sus coeficientes.
Para evitar esto es necesario estabilizar la serie liberndola de la estacionalidad; esto se
podra conseguir trabajando con los valores medios anuales, que son los de la tabla 3.III. En
la tabla 3.IV se detallan los resultados del clculo del modelo de tendencia, considerado tipo
rectilneo.
Y
a
t (aos) Y
a
t (aos)
67,4925
67,1550
71,1875
1
2
3
75,0900
80,7425
79,7725
4
5
6
Tabla 3.III.- Medias anuales de ventas de material deportivo
nu S.C. C.M. F p-val
Regresin 1 160,711 160,711 42,073 0,003
Residuos 4 15,279 3,820
Total 5 175,991
Coef. Error tpico t p-val
Ord. Origen 62,967 1,819 34,607 0,000
t(aos) 3,030 0,467 6,486 0,003
R^2 = 0,91318
Tabla 3.IV.- Modelo lineal para las medias anuales
Los autores, 2001; Edicions UPC, 2001.
p24 Series temporales
Ahora ya se ha obtenido un modelo de tendencia altamente significativo y con un buen
ajuste (R^2 = 91,3%). En la figura 3.2 se han representado las medias anuales junto a la
estimacin del modelo de tendencia; se observa la estabilizacin conseguida en los valores
de las medias anuales, ya que mientras los datos directos oscilaban entre 40 y 130, las
medias anuales van desde 67 hasta 81.
Hay que destacar que con esta estabilizacin se ha conseguido un modelo de tendencia
significativo; sin embargo, es aceptable este procedimiento? La respuesta sera no, ya que
este sistema tiene el inconveniente de la gran prdida de informacin, pues de los 24 datos
iniciales, se ha acabado estimando el modelo con slo 6 puntos. Este inconveniente queda
paliado desestacionalizando la serie con las medias mviles.
65
70
75
80
85
0 1 2 3 4 5 6 7
t(aos)
Y
a
Fig. 3.2.- Evolucin y tendencia de la media anual
3.1 Medias mviles: tendencia
Con este mtodo se consiguen suavizar tanto las oscilaciones peridicas de una serie como
las aleatorias. Su aplicacin requiere decidir, previamente, el perodo en que se repite cierto
patrn de comportamiento, que pueda atribuirse a variaciones estacionales; la observacin
de la evolucin grfica de la serie puede ayudar a tomar la decisin.
Una vez fijado el perodo p, se calculan las medias de los valores de la serie tomados de p
en p, sucesivamente desde el inicio. Asociando cada una de estas medias al valor del
tiempo del punto central del perodo estudiado, se obtiene una nueva serie de valores
mucho ms estables, debido, por una parte, a la reduccin de la variabilidad ocasionada al
promediar y, por otra, a que, si el perodo escogido es el correcto, al pasar de una media
mvil a la siguiente, el nuevo dato incorporado es del mismo comportamiento que el dato
saliente.
Si p es impar la asociacin es directa :
p + 1
t =
2

p
i
1 2 p
i 1
(p 1) / 2
Y
Y Y Y
Y
p p
=
+
+ + +
= =

A
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p25
p + 3
t =
2

p 1
i
2 3 p 1
i 2
(p 3) / 2
Y
Y Y Y
Y
p p
+
+
=
+
+ + +
= =

Si p es par, el centro del grupo de cada p valores promediados corresponde a un valor no


observado del tiempo; para subsanarlo, la nueva serie queda constituida por los promedios
de las medias mviles tomadas dos a dos. Es decir:
p + 2
t =
2

(p 1) / 2 (p 3) / 2
(p 2) / 2
Y Y
Y
2
+ +
+
+
=
p + 4
t =
2

(p 3) / 2 (p 5) / 2
(p 4) / 2
Y Y
Y
2
+ +
+
+
=

La representacin grfica de las medias mviles, o la regresin de dichos valores frente al
tiempo, permiten evaluar la tendencia de la serie liberada de la componente estacional.
Uno de los inconvenientes de este sistema es la prdida de valores en los dos extremos de
la serie, tanto mayor cuanto mayor es p. En ocasiones, se propone como alternativa a este
problema la sustitucin de los valores extremos de las medias mviles por los resultantes de
una extrapolacin lineal de los observados; sin embargo, si el nmero de datos disponibles
es grande, la prdida de informacin es negligible.
En el caso del ejemplo de las ventas de material deportivo, ya se ha comentado que la
estacionalidad se manifiesta de forma anual, es decir, cada cuatro trimestres; ello conduce
al clculo de las medias mviles tomando p = 4.
En la tabla 3.V se detalla el clculo de los primeros valores de la nueva serie, y la tabla 3.VI
resume la totalidad de los mismos.
t
Y Y
t
1
2
3
4
5



40,22
54,89
63,51
111,35
46,95
67,4925
69,1750
68,3337
3
4
5

Tabla 3.V.- Detalle del clculo de las medias mviles con p = 4


Los autores, 2001; Edicions UPC, 2001.
p26 Series temporales
t
Y
t
Y
t
Y
t
Y
3
4
5
6
7
68,3337
68,7662
68,1025
67,5012
66,4588
8
9
10
11
12
67,4725
69,5300
70,5325
72,6825
73,4363
13
14
15
16
17
72,9325
74,1300
76,8450
78,1900
78,9000
18
19
20
21
22
80,3812
79,3075
78,5175
79,2037
79,5088
Tabla 3.VI.- Medias mviles con p = 4
Los resultados del modelo lineal,
0 1
Y t = + + para el clculo de la tendencia constan en
la tabla 3.VII.
nu S.C. C.M. F p-val
Regresin 1 393,692 393,692 162,810 0,000
Residuos 17 41,108 2,418
Total 18 434,800
Coef. Error tpico t p-val
Ord. Origen 63,0065 0,9188 68,5739 0,0000
t 0,8311 0,0651 12,7597 0,0000
R^2 = 0,905
Tabla 3.VII.- Modelo de tendencia sobre las medias mviles
Trabajando sobre 19 puntos, los 19 valores de las medias mviles, se ha obtenido un buen
ajuste, con un coeficiente de determinacin del 90,5 %. En consecuencia, el modelo de
tendencia resultante es
T = 63,0065 + 0,8311 t
Evidentemente, la interpretacin de la ecuacin de la tendencia permite afirmar que las
ventas se incrementan 0,8311 unidades cada trimestre (ya que el tiempo se ha medido en
trimestres). En la figura 3.3 puede observarse el suavizado conseguido con las medias
mviles junto con el modelo de tendencia estimado a partir de los citados valores.
40
70
100
130
0 4 8 12 16 20 24 t
Fig. 3.3.- Evolucin ( ), medias mviles ( 1 ) y tendencia ( ), para p = 4
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p27
3.2 Estacionalidad
La componente estacional, que provoca una oscilacin sistemtica de perodo corto,
generalmente no superior al ao, puede enmascarar la evolucin a largo plazo, tendencia, si
no se asla convenientemente.
Se entiende como componente estacional, en modelos aditivos, la diferencia entre el valor
de la estacin y la media de todas las estaciones componentes del perodo.
El anlisis de la estacionalidad queda ligado al mtodo que se decida emplear para
modelizar la tendencia; as, en este punto estudiaremos la situacin para el caso de trabajar
con medias mviles.
Para calcular los valores de los ndices estacionales hay que seguir la siguiente sistemtica:
n Calcular las medias mviles,
t
Y , sobre los datos,
t
Y , de la serie original, tomando el
perodo de agrupacin, p, que se considere oportuno.
n Proponer un modelo de agrupacin de las componentes, aditivo o multiplicativo.
n Separar la parte explicada por la tendencia. Supuesto el modelo aditivo, esto equivale a
calcular
t
W=
t
Y
t
Y ; si fuese multiplicativo, en lugar de diferencias seran cocientes, es
decir,
t
W=
t
Y /
t
Y . Hay que destacar que en
t
W estn incluidas las componentes
asociadas a la estacionalidad, los ciclos y los residuos.
n Asumiendo que los residuos son variables aleatorias de media nula y que la
componente cclica, caso de existir, es de perodo suficientemente largo como para no
ser recogida por los datos, se procede a evaluar la estacionalidad asociada a cada
componente del perodo, a cada trimestre en el caso del ejemplo. Para ello se calculan
los promedios de los
t
Wde la misma estacin
t
t s p *
s
s
W
E
n
= +
=

&
s = 1, , p
donde s representa el ndice estacional y n
s
el nmero de valores asociados a este
ndice que se promedian.
Ya que los ndices estacionales miden discrepancias respecto a la media, sta se
necesita como valor de referencia; por tanto es necesario calcular la media general:
p
*
s
s = 1

E
E =
p

n Calcular los ndices estacionales en modelo aditivo


Los ndices estacionales son las diferencias entre los promedios de las
t
W de cada
estacin y la media general que se acaba de definir, es decir
*
s s
E E E =
L o s a u t o r e s , 2 0 0 1 ; E d i c i o n s U P C , 2 0 0 1 .
p28 Series temporales
Es obvio destacar que la suma de estos ndices es cero:
p
s
s 1
E 0
=
=

.
n Calcular los ndices estacionales en modelo multiplicativo.
En este caso, los ndices estacionales son el cociente entre los promedios de las
t
W de
cada estacin y la media general, es decir
*
s
s
E
E
E
=
Ahora, la suma de estos ndices es igual al perodo,
p
s
s 1
E p
=
=

. En modelo
multiplicativo, no es extrao que los ndices estacionales se representen en %.
En la tabla 3.VIII se detallan los clculos del caso de modelo aditivo de las ventas de
material deportivo. Por ejemplo, para el tercer trimestre (s = 3), el promedio de las Wt, cuyos
valores del tiempo correspondiesen al tercer trimestre, por ser mltiplos de 4 ms 3 (t = 3, 7,
11, 15, 19), sera:
*
3
-4,8237 - 4,9888 - 8,4325 - 10,6950 - 4,1975
= = - 6,6275
E
5
t
t
Y
t
Y
t
W Estacin: s
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
40,22
54,89
63,51
111,35
46,95
51,62
61,47
108,58
41,38
65,30
64,25
113,82
53,34
59,37
66,15
121,5
67,38
56,09
75,11
124,39
55,90
61,25
75,44
126,5
---
---
68,3337
68,7662
68,1025
67,5012
66,4588
67,4725
69,5300
70,5325
72,6825
73,4363
72,9325
74,1300
76,8450
78,1900
78,9000
80,3812
79,3075
78,5175
79,2037
79,5088
---
---
---
---
-4,8237
42,5838
-21,1525
-15,8812
-4,9888
41,1075
-28,1500
-5,2325
-8,4325
40,3837
-19,5925
-14,7600
-10,6950
43,3100
-11,5200
-24,2912
-4,1975
45,8725
-23,3037
-18,2588
---
---
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
Tabla 3.VIII.- Evaluacin de la estacionalidad por medias mviles.
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p29
Anlogamente, para cada trimestre, se obtiene:
* * * *
1 2 3 4
E 20,7438 E 15,68477 E 6,6275 E 42,6515 = = = =
La media general es:
4
*
s
s 1
E
E 0,101125
4
=
= =

y los ndices estacionales, resultan


E
1
= 20,6426 E
2
= 15,5836 E
3
= 6,5264 E
4
= 42,7526
Los valores de los ndices estacionales recin obtenidos se interpretan de la siguiente forma:
respecto a la media, el primer trimestre tiene una venta inferior en 20,6426 unidades; el
segundo est 15,5836 unidades por debajo de la media; el tercero 6,5264; mientras que el
cuarto supera a la media en 42,7526 unidades de venta.
Con el modelo de tendencia de la tabla 3.VII y la estacionalidad, se ha obtenido la
descomposicin de la serie original, mostrada en la figura 3.4.
Evidentemente, los residuos se calculan como : R = Y - T - E. La buena modelizacin
conseguida queda confirmada por los residuos, ya que en su mayora estn en el intervalo
5 y slo en 3 puntos se llega a valores de 10 u 11 unidades.
Tal como se ha ido repitiendo, el objetivo de la modelizacin de la serie es poder realizar
previsiones para los prximos valores del tiempo. En la tabla 3.IX se presentan las
previsiones para los 2 aos inmediatos siguientes. Atendiendo a que el perodo estacional
es igual a 4, para realizar la previsin hay que identificar el tiempo como un mltiplo de 4
ms s (s = 1, 2, 3, 4), para aadir a la tendencia el valor correcto de la estacionalidad. As,
la previsin se calcula como:
t
Y
#
= 63,0065 + 0,8311 t + E
s
con t = 4
$
+ s
La figura 3.5 muestra la evolucin de las previsiones y su buena concordancia con la
evolucin histrica de los datos recogidos en el estudio.
Los autores, 2001; Edicions UPC, 2001.
p30 Series temporales
40
70
100
130
Y
64
69
74
79
84
T
-30
-10
10
30
50
E
-11
0
11
t
R
40
70
100
130
T
+
E
Fig. 3.4.- Descomposicin de la serie de ventas de material deportivo por medias mviles
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p31
Ao t Estacin: s
Tendencia:
T = 63,0065+0,8311 t
Estacionalidad: E
Previsin: Y
#
1996
25
26
27
28
1
2
3
4
83,7840
84,6151
85,4462
86,2773
20,6426
15,5836
6,5264
42,7526
63,1414
69,0315
78,9198
129,0299
1997 29
30
31
32
1
2
3
4
87,1084
87,9395
88,7706
89,6017
20,6426
15,5836
6,5264
42,7526
66,4658
72,3559
82,2442
132,3543
Tabla 3. IX.- Previsiones para 1996 y 1997, segn el modelo de descomposicin clsica
40
90
140
0 4 8 12 16 20 24 28 32 t
Y
Fig. 3.5.- Evolucin histrica ( ), modelo ( ) y previsiones ( p )
3.3 Caso temperaturas
La tabla 3.X presenta las temperaturas medias mensuales registradas en una ciudad del
hemisferio sur, en el perodo de tiempo que abarca desde enero de 1986 a diciembre de
1995. Interesa estudiar el modelo de comportamiento y realizar una previsin de las
temperaturas de la dcada siguiente.
Los autores, 2001; Edicions UPC, 2001.
p32 Series temporales
Ao
Mes 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
26,8
27,2
27,1
26,3
25,4
23,9
23,8
23,6
25,3
25,8
26,4
26,9
27,1
27,5
27,4
26,4
24,8
24,3
23,4
23,4
24,6
25,4
25,8
26,7
26,9
26,3
25,7
25,7
24,8
24,0
23,4
23,5
24,8
25,6
26,2
26,5
26,8
26,9
26,7
26,1
26,2
24,7
23,9
23,7
24,7
25,8
26,1
26,5
26,3
27,1
26,2
25,7
25,5
24,9
24,2
24,6
25,5
25,9
26,4
26,9
27,1
27,1
27,4
26,8
25,4
24,8
23,6
23,9
25,0
25,9
26,3
26,6
26,8
27,1
27,4
26,4
25,5
24,7
24,3
24,4
24,8
26,2
26,3
27,0
27,1
27,5
26,2
28,2
27,1
25,4
25,6
24,5
24,7
26,0
26,5
26,8
26,3
26,7
26,6
25,8
25,2
25,1
23,3
23,8
25,2
25,5
26,4
26,7
27,0
27,4
27,0
26,3
25,9
24,6
24,1
24,3
25,2
26,3
26,4
26,7
Tabla 3.X.- Registro de las temperaturas mensuales
La evolucin cronolgica de los datos se muestra en la figura 3.6, en donde se pone de
manifiesto que la tendencia es prcticamente inapreciable, por la aparente horizontalidad del
eje virtual de la serie. Por otra parte se observa la existencia de una componente estacional
clara que se repite, lgicamente, cada ao y mantiene la amplitud, dando idea de que es un
modelo aditivo. Al ser los datos mensuales, la longitud del perodo es igual a 12.
El clculo de las medias mviles, con p = 12, y su representacin grfica (figura 3.7)
confirman la estacionalidad, por la estabilizacin conseguida en la serie, pero ponen en
entredicho la ausencia de tendencia.
La observacin del grfico hace recomendable ajustar un modelo de tendencia, que se har
posteriormente y que ya se ha representado en esta figura.
22
24
26
28
30
0 24 48 72 96 120 t
Y
Fig. 3.6.- Evolucin cronolgica de las temperaturas
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p33
22
24
26
28
30
0 24 48 72 96 120
t
Y
Fig. 3.7.- Temperaturas mensuales ( ), medias mviles ( ) y lnea de tendencia ajustada ( )
Para evaluar la estacionalidad es necesario calcular los ndices estacionales, tal como se ha
detallado en el apartado 3.2. Los resultados obtenidos se encuentran en la tabla 3.XI, y se
presentan grficamente en la figura 3.8.
Mes (s) ndice E
s
Mes (s) ndice E
s
I 1
II 2
III 3
IV 4
V 5
VI 6
1,07496
1,31478
0,97867
0,62126
0,15883
1,03569
VII 7
VIII 8
IX 9
X 10
XI 11
XII 12
1,78846
1,80143
0,77967
0,05413
0,52959
0,99070
Tabla 3.XI.- ndices estacionales
La interpretacin de los ndices es simple: desde octubre (X) a abril (IV), la temperatura est
por encima de la media anual; mientras que de mayo (V) a septiembre (IX) est por debajo
de la media. No olvidemos que los datos corresponden a una ciudad del hemisferio sur; por
tanto, de octubre a abril son los meses clidos, y los dems son los fros. Es de destacar
que la oscilacin trmica media, del mes ms clido al ms fro, es relativamente pequea
(1,31 + 1,80 = 3,01C). Esto, unido a los valores medios mensuales, que oscilan entre 23 y
29C permite afirmar que el estudio se est haciendo sobre una ciudad de clima muy suave
y casi permanentemente primaveral.
Los autores, 2001; Edicions UPC, 2001.
p34 Series temporales
-2
-1
0
1
2
0 4 8 12
s
T
Fig. 3.8.- Componente estacional: ndices
La tendencia, aunque dbil, existe y es de tipo lineal. Su evaluacin se efectuar mediante
el modelo lineal aplicado a las medias mviles (tabla 3.XII).
nu S.C. C.M. F p-val
Regresin 1 2,186 2,186 44,512 0,000
Residuos 106 5,205 0,049
Total 107 7,391
Coeficientes Error tpico t p-val
Ord. Origen 25,4733 0,0459 554,4281 0,0000
t 0,00456 0,0007 6,6717 0,0000
R^2 = 0,295735
Tabla 3.XII.- Modelo lineal para la tendencia:
t
Y =
0
+
1
t +
A pesar del valor del coeficiente de determinacin del ajuste, (29,57 %), la explicacin del
modelo es significativa. As, se puede deducir que parece existir una tendencia muy ligera a
un incremento de la temperatura, que se ha estimado en un aumento de 0,00456 grados
mensuales en promedio.
La evolucin del modelo, junto con los datos reales, se presentan en la figura 3.9. Para su
obtencin, hay que tener en cuenta que, conocidos los ndices estacionales y el modelo de
tendencia, la suma mes a mes de los dichos valores darn lugar al modelo propuesto, es
decir:
t
Y
#
= 25,4733 + 0,00456 t +
s
E con t = 12
$
+ s s = 1, , 12
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p35
22
24
26
28
30
0 24 48 72 96 120 t
Y
Fig. 3.9.- Datos ( ) y modelo ajustado ( )
Solamente hay que destacar la buena concordancia entre ambos, a pesar de que hay
algunos puntos que parecen presentar mayores discrepancias.
Esto ocurre, principalmente, desde abril hasta julio de 1993 que como, puede observarse, ya
en los datos iniciales presentaron unas temperaturas medias bastante superiores a las de
los dems aos (es decir hizo un otoo especialmente clido).
En la figura 3.10, se muestran los residuos resultantes de la descomposicin de esta serie,
obtenidos como
t t t
R Y Y =
#
. Hay que destacar la buena modelizacin conseguida, pues
en la mayora de las 120 observaciones, el error es inferior a un grado, excepto en los
meses ya comentados.
-2
-1
0
1
2
0 24 48 72 96 120
t
R
Fig. 3.10.- Residuos del modelo
Los autores, 2001; Edicions UPC, 2001.
p36 Series temporales
A partir de la descomposicin, y suponiendo que no cambiase el comportamiento
meteorolgico de la zona, la previsin de la temperatura para los 10 aos siguientes sera la
de la tabla 3.XIII, que se muestra en la figura 3.11 junto a los datos disponibles. Aqu se
observa que, de mantenerse la tendencia, la temperatura media mensual, poco a poco, se
va incrementando.
Comparando los datos reales con las previsiones, se ve en estas ltimas la ausencia del
componente aleatorio. Se est haciendo una previsin de temperaturas medias, pero el azar
meteorolgico se unir a la previsin alterndola en aquellos perodos de tiempo en los que
las temperaturas sean distintas a las de la tnica general: inviernos muy fros o muy suaves,
veranos ms extremos, etc.
Ao
Mes 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
27,1
27,3
27,0
26,7
25,9
25,0
24,3
24,3
25,3
26,1
26,6
27,1
27,2
27,4
27,1
26,7
25,9
25,0
24,3
24,3
25,3
26,2
26,7
27,1
27,2
27,5
27,1
26,8
26,0
25,1
24,4
24,4
25,4
26,2
26,7
27,2
27,3
27,5
27,2
26,8
26,1
25,1
24,4
24,4
25,5
26,3
26,8
27,2
27,3
27,6
27,2
26,9
26,1
25,2
24,5
24,5
25,5
26,3
26,8
27,3
27,4
27,6
27,3
26,9
26,2
25,2
24,5
24,5
25,6
26,4
26,9
27,3
27,4
27,7
27,3
27,0
26,2
25,3
24,6
24,6
25,6
26,5
26,9
27,4
27,5
27,7
27,4
27,0
26,3
25,3
24,7
24,6
25,7
26,5
27,0
27,5
27,5
27,8
27,5
27,1
26,3
25,4
24,7
24,7
25,7
26,6
27,0
27,5
27,6
27,8
27,5
27,2
26,4
25,5
24,8
24,8
25,8
26,6
27,1
27,6
Tabla 3.XIII.- Temperatura prevista para los 10 aos siguientes a la recogida de datos
22
24
26
28
30
0 48 96 144 192 240 t
Fig. 3.11.- Datos desde 1986 a 1995 ( ) y previsiones desde 1996 a 2005 ( 1 )
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p37
3.4 Caso usuarios transporte pblico
En la tabla 3.XIV se recogen los datos relativos al nmero de usuarios de un determinado
transporte pblico en el perodo que abarca desde 1984 hasta 1995, y la figura 3.2 muestra
su evolucin cronolgica.
Ao
Mes 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
90
88
109
103
103
122
134
132
115
101
91
112
111
115
129
121
112
125
164
158
133
127
110
120
127
107
141
135
133
154
175
174
158
139
112
140
142
139
145
162
144
176
192
190
160
151
134
140
146
155
182
165
165
191
195
205
182
165
138
155
164
151
180
164
184
206
198
235
197
163
148
163
175
161
179
195
189
208
227
249
224
193
170
166
176
194
197
211
191
235
248
273
202
189
167
168
208
189
232
226
222
245
252
242
229
202
192
198
199
190
228
220
222
233
303
253
253
223
191
185
207
198
251
231
234
251
316
285
250
232
190
201
219
206
229
223
231
266
290
294
258
214
206
199
Tabla 3. XIV.- Usuarios de un transporte pblico.
80
160
240
320
0 24 48 72 96 120 144 t
Y
Fig. 3.12.- Evolucin cronolgica del nmero de usuarios.
La observacin de la figura 3.12 permite realizar las siguientes consideraciones:
Se detecta una clara tendencia creciente en el tiempo.
Hay una estacionalidad manifiesta que se repite anualmente. Ya que los datos son
mensuales, su perodo ser igual a 12.
Los autores, 2001; Edicions UPC, 2001.
p38 Series temporales
El patrn de estacionalidad tiene una forma constante pero presenta una amplificacin
continua en el tiempo. Esta situacin es la que indica que el modelo subyacente es
multiplicativo.
Para obtener la descomposicin de la serie cronolgica, es necesario estabilizarla
previamente, mediante medias mviles de p = 12; y despus modelizar la tendencia y
calcular los ndices estacionales.
La evolucin de las medias mviles se muestra en la figura 3.13, y se aprecia un crecimiento
que no es proporcional al tiempo, sino que parece sufrir un amortiguamiento al final de la
serie; es decir, probablemente se tratar de un modelo parablico.
80
160
240
320
0 24 48 72 96 120 144 t
Fig. 3.13.- Tendencia a travs de las medias mviles (p =12)
La estimacin mnimo-cuadrtica conduce al modelo de tendencia, sobre las medias
mviles, cuya estimacin se muestra en la tabla 3.XV. En ella se observa, adems de un
muy buen ajuste reflejado por una R
2
del 99,74%, que el trmino cuadrtico es altamente
significativo. El signo negativo de este trmino da idea de una especie de freno en el
crecimiento sostenido del nmero de usuarios, representado por el coeficiente positivo del
tiempo.
nu S.C. C.M. F p-val
Regresin 2 194340,33 97170,17 25069,58 7,937E-168
Residuos 129 500,01 3,88
Total 131 194840,34
Coeficientes Error tpico t p-val
Ord. Origen 100,4749 0,6227 161,3636 1,08E-150
t 1,4326 0,0197 72,8823 1,08E-106
t^2 -0,00297 0,0001 -22,5088 1,66E-46
R^2 = 0,9974
Tabla 3.XV.- Estimacin del modelo de tendencia: Y=
0
+
1
t +
2
t
2
+
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p39
As pues, el modelo de tendencia puede escribirse como:
T = 100,4749 + 1,4326 t 0,00297 t
2
En modelos multiplicativos, como el del actual ejemplo, la componente estacional representa
la relacin entre cada estacin y la media general. Recordemos que, en estos casos, el
clculo de la estacionalidad se realiza de acuerdo con los siguientes pasos:
a) Calcular las medias mviles
t
Y , a partir de los datos, Y
t
, de la serie.
b) Separar la tendencia, es decir, calcular
t
t
t
Y
W
Y
= .
c) Asumiendo que los ciclos, caso de existir, son de perodo suficientemente largo como
para no ser recogidos por los datos, calcular los promedios de las Wt de cada estacin y la
media general. s es el indicador de la estacin (mes, en el ejemplo), y n
s
el nmero de
valores de W que se promedian en la citada estacin
t
t s p *
s
s
W
E
n
= +
=

$
s = 1, ..., p y
p
*
s
s 1
E
E
p
=
=

d) Finalmente, los valores de las componentes estacionales, generalmente expresados en %


en modelos multiplicativos, se obtienen como:
*
s
s
E
E 100
E
=
En la tabla 3.XVI se muestran los valores de las componentes estacionales del presente
ejemplo, y se representan grficamente en la figura 3.14.
Mes E
s
Mes E
s
Mes E
s
I
II
III
IV
92,38
88,41
101,72
99,21
V
VI
VII
VIII
97,04
109,53
121,91
121,31
IX
X
XI
XII
105,50
94,11
81,54
87,33
Tabla 3.XVI.- Componente estacional.
Los autores, 2001; Edicions UPC, 2001.
p40 Series temporales
80
90
100
110
120
130
0 4 8 12
t
E
Fig. 3.14.-ndices estacionales
La interpretacin de los ndices podra ser en el sentido de que, por ejemplo, los usuarios de
los meses de julio y agosto son del orden de un 121% superior a la media, mientras que en
noviembre se est en un 81% de la media. Ello podra aconsejar una promocin en los
meses de noviembre, diciembre, enero y febrero, con el fin de conseguir una mayor
ocupacin de las plazas disponibles.
La figura 3.15 muestra la concordancia entre los datos y su modelizacin, a partir de la
tendencia y estacionalidad calculadas, de acuerdo con el modelo multiplicativo:
( )
2 s
t
E
Y 100,4749 1,4326 t 0,00297 t
100
= +
#
s = 1, ..., 12 t = s + 12
$
80
160
240
320
0 24 48 72 96 120 144
t
Fig. 3.15.- Serie cronolgica experimental ( ) y ajustada ( ! !! !).
Observando la figura 3.15 se puede destacar que hay unos desajustes ms acusados en
ciertos meses de julio o agosto, en concreto, los de los aos 1989, 90, 91, 93 y 94, por lo
que es posible afirmar que en los casos citados ha habido un comportamiento
sustancialmente distinto del esperado en los mismos meses de otros aos; en principio,
sera discutible afirmar la presencia de un cambio en los hbitos de utilizacin de este
transporte, ya que ni el ao 1993 ni el 1995, pertenecientes al perodo en cuestin,
presentan semejantes discrepancias.
Los autores, 2001; Edicions UPC, 2001.
Descomposicin de una serie temporal p41
A pesar de todo, en este caso, sera prudente tomar con ciertas precauciones las
previsiones para aos venideros, mientras no se confirme la consolidacin en el futuro de un
cambio o de una permanencia de comportamiento. Tambin podra ser interesante intentar
averiguar qu ocurri en estos meses (quizs una campaa publicitaria, quizs una
disminucin de alternativas de la competencia,...).
La figura 3.16 muestra la evolucin de los residuos entre los datos experimentales y el
modelo ajustado, R
t
= Y
t

t
Y
#
. Se observa que, en la mayora de los casos, oscilan entre 16,
aunque en algn caso la discrepancia se aproxima a 30 unidades.
Asumiendo que se mantiene el mismo modelo, la previsin de usuarios hasta el ao 2000 se
presenta en la figura 3.17. Hay que tener en cuenta, para realizar correctamente los
clculos, que el ltimo valor de t para el que se dispone de datos, diciembre de 1995, es
144; por tanto, para las predicciones, que abarcan el perodo de los prximos 60 meses, los
valores de t irn desde 145 hasta 204.
-32
-16
0
16
32
0 24 48 72 96 120 144
t
R
Fig. 3.16.- Residuos del modelo ajustado
En el grfico de la previsin se puede observar la reduccin de la velocidad de crecimiento
inicial de la serie que se ha comentado en la modelizacin de la tendencia.
80
130
180
230
280
330
0 24 48 72 96 120 144 168 192 t
Previsiones Datos
Fig. 3.17.- Serie observada y previsiones hasta el ao 2000
Los autores, 2001; Edicions UPC, 2001.
p42 Series temporales
4 MODELIZACIN CON VARIABLES CATEGRICAS
Tal como se ha comentado en el captulo anterior, si hubiera estacionalidad, estimar el modelo
de tendencia sobre los datos directos, por procedimientos usuales de ajuste mnimo-
cuadrtico, sera improcedente. Ello es debido a que se producira una inflacin de los
residuos no atribuible a la aleatoriedad sino a la variabilidad ocasionada por el componente
estacional. Para evitarlo, se pueden modelizar conjuntamente la tendencia y la estacionalidad
con variables categricas asociadas a cada estacin, o bien desestacionalizar previamente la
serie y entonces ajustar el modelo de tendencia, como ya se ha expuesto.
La modelizacin conjunta, con variables categricas, de la tendencia y la estacionalidad
presenta como principal ventaja la generalidad del mtodo. Por este procedimiento no es
necesario, a priori, asumir un modelo aditivo o multiplicativo, sino que se plantea un modelo
general que incluye todas las posibilidades.
Sea p el perodo estacional, es decir, el nmero de unidades de tiempo que conforman el
patrn de comportamiento que se repite sistemticamente. Cada uno de los valores del
tiempo contenidos en p corresponde a una estacin, la cual se designar por el subndice s,
de forma que s = 1, 2, ..., p.
Cada estacin debe estar ligada biunvocamente a una variable categrica. Dicha variable
es un indicador que toma el valor 1 en la estacin a la que est asociada y 0 en todas las
dems, excepto para la primera estacin, en que todas toman el valor 0. sta es la razn
por la cual con p-1 variables categricas es suficiente para estudiar una serie de perodo p.
Las variables categricas, Q, quedan, pues, definidas como
j
j
Q 0 j s
con s 1 , 2 , , p y j 2 , , p
Q 1 j s
=

= =

= =

@ @
Con estas variables se plantea un modelo tipo
p p
Y = ( t ) + Q t +
Q
j j
j j
j 2 j = 2
+
=
donde (t) es una funcin polinmica del tiempo, o sea,
k
i
0 i
i 1
(t) + t
=
=

, que viene a
recoger la tendencia o evolucin general, a largo plazo, de los datos con el tiempo. Los
trminos del grupo
p
j j
j 2
Q
=

indican los cambios que las distintas estaciones, componentes


del perodo estacional, introducen en la ordenada en el origen del modelo, parte aditiva
segn el sistema clsico. Mientras que los del grupo
p
j j
j 2
Qt
=

representan la influencia de la
estacionalidad sobre la funcin del tiempo, lo que en el mtodo clsico se interpreta como
parte multiplicativa.
El estudio de la significacin de cada uno de los coeficientes , y , y la consiguiente
eliminacin de los no significativos conducir el modelo que definitivamente explica el
comportamiento de la serie.
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p43
Para desarrollar la metodologa de las variables categricas sobre un ejemplo, se van a utilizar
los datos relativos a las ventas de material deportivo estudiados por el mtodo clsico, con el
fin de poder comparar posteriormente los resultados obtenidos. En la tabla 4.I se vuelven a
reproducir los datos de la serie cronolgica, junto a los valores de las variables categricas. La
representacin grfica de los mismos ya se present en la figura 3.1, cuya observacin
condujo a pensar en una tendencia lineal creciente y una estacionalidad de perodo p = 4.
A fin de no confundir los dos efectos, procede la creacin de variables categricas que
identifiquen cada una de las cuatro estaciones, que en este ejemplo constituyen el perodo
de repeticin del patrn estacional. Por otra parte, suponiendo que hubiese ciclos, el
intervalo de tiempo de recogida de datos es totalmente insuficiente para tomarlos, por lo que
su posible existencia quedar enmascarada en los residuos.
En la tabla 4.I estn las variables categricas Q2, Q3 y Q4, cuya conjuncin representa de
forma unvoca cada trimestre. Se insiste en que no es necesaria una Q1, puesto que el
primer trimestre es el que toma como referencia Q2 = Q3 = Q4 = 0, y son los dems que, a
travs del indicador, aportarn la parte del efecto estacional correspondiente.
En este caso, al ser la tendencia rectilnea, se plantea el modelo
0 1 2 2 3 3 4 4 2 2 3 3 4 4
Y t Q Q Q Q t Q t Q t = + + + + + + + +
La estimacin de sus parmetros conduce a los resultados expuestos en la tabla 4.II.
Ao Trimestre (s) Ventas (Y) Q
2
Q
3
Q
4
t
1990 1
2
3
4
40,22
54,89
63,51
111,35
0
1
0
0
0
0
1
0
0
0
0
1
1
2
3
4
1991 1
2
3
4
46,95
51,62
61,47
108,58
0
1
0
0
0
0
1
0
0
0
0
1
5
6
7
8
1992 1
2
3
4
41,38
65,30
64,25
113,82
0
1
0
0
0
0
1
0
0
0
0
1
9
10
11
12
1993 1
2
3
4
53,34
59,37
66,15
121,5
0
1
0
0
0
0
1
0
0
0
0
1
13
14
15
16
1994 1
2
3
4
67,38
56,09
75,11
124,39
0
1
0
0
0
0
1
0
0
0
0
1
17
18
19
20
1995 1
2
3
4
55,90
61,25
75,44
126,50
0
1
0
0
0
0
1
0
0
0
0
1
21
22
23
24
Tabla 4.I.- Ventas de material deportivo
Los autores, 2001; Edicions UPC, 2001.
p44 Series temporales
Los resultados del modelo lineal general evidencian que todos los trminos del tipo Q
j
t no
son estadsticamente significativos, (p-val < 0,05), por tanto procede recalcular el modelo
prescindiendo de ellos.
Cabe destacar que este hecho manifiesta que la estacionalidad no modifica la pendiente de
la recta del tiempo, es decir, el incremento de las ventas es el mismo para cada trimestre.
Esto simplifica el caso al corresponder a un modelo aditivo puro, que puede ser,
alternativamente, estudiado por la metodologa de la descomposicin clsica, tal como se ha
hecho en el captulo 3. Si alguno de esos trminos hubiese resultado significativo, el sistema
clsico proporcionara un modelo bastante precario.
nu S.C. C.M. F p-val
Regresin 7 17166,997 2452,428 109,609 0,000
Residuos 16 357,988 22,374
Total 23 17524,985
Coeficientes Error tpico t p-val
Ord. Origen 38,9463 3,660 10,640 0,000
Q2 15,7735 5,351 2,948 0,009
Q3 19,1936 5,535 3,468 0,003
Q4 65,6577 5,726 11,466 0,000
t 1,0832 0,283 3,832 0,001
t*Q2 -0,8026 0,400 -2,008 0,062
t*Q3 -0,3513 0,400 -0,879 0,393
t*Q4 -0,1485 0,400 -0,371 0,715
R^2 = 0,9796
Tabla 4.II.- Resultados del modelo lineal general
La tabla 4.III contiene los resultados del ajuste del modelo definitivo, es decir, de
0 1 2 2 3 3 4 4
Y t Q Q Q = + + + + +
nu S.C. C.M. F p-val
Regresin 4 17064,626 4266,157 176,073 0,000
Residuos 19 460,359 24,229
Total 23 17524,985
Coeficientes Error tpico t p-val
Ord. Origen 42,5280 2,580 16,484 0,000
Q2 6,4674 2,846 2,273 0,035
Q3 15,2781 2,857 5,347 0,000
Q4 64,5555 2,876 22,447 0,000
t 0,7576 0,147 5,151 0,000
R^2 = 0,97373
Tabla 4.III.- Resultados del modelo definitivo
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p45
Los grficos de residuos y probabilstico Normal se presentan en la figura 4.1, y no
presentan ninguna peculiaridad especial.
En consecuencia queda validado el modelo obtenido.
Res
4 7
0
Y

Res
0 4 8
0
t
%P
0








9
Res
Fig. 4.1.- Grficos de los residuos del modelo
Como resumen de todo lo anterior, el modelo que explica el comportamiento de la serie, y
que va a ser utilizado para hacer previsiones de las ventas futuras, ha resultado ser
t 2 3 4
Y 42,5280 0,7576t 6,4674Q 15,2781Q 64,5555Q = + + + +
#
La interpretacin de los coeficientes del modelo permite identificar tendencia y
estacionalidad.
En cuanto a la primera, se detecta un incremento de las ventas de 0,7576 unidades cada
unidad de tiempo (trimestre); incremento que se mantiene constante sea cual sea la
estacin.
En consecuencia, la estacionalidad slo afecta a la ordenada en el origen de cada una de
las cuatro estaciones (trimestres) que componen el perodo.
Tomando como referencia el primer trimestre, en el que Q
2
= Q
3
= Q
4
= 0, se observa que en
l las ventas dependen del tiempo, segn la ecuacin
t
Y
#
= 42,5280 + 0,7576 t con t = 1 + 4
$
Los autores, 2001; Edicions UPC, 2001.
p46 Series temporales
Para un tiempo correspondiente a un segundo trimestre, las variables categricas toman los
valores Q
2
= 1 y Q
3
= Q
4
= 0 y el modelo es
t
Y
#
= 42,5280 + 0,7576 t + 6,4674 = 48,9954 + 0,7576 t con t = 2 + 4
$
Para un tiempo de tercer trimestre, las variables categricas toman los valores Q
3
= 1 y Q
2
=
Q
4
= 0 y el modelo es
t
Y
#
= 42,5280 + 0,7576 t + 15,2781 = 57,8061 + 0,7576 t con t = 3 + 4
$
Y, en el caso del cuarto trimestre, las variables categricas toman los valores Q
4
= 1 y
Q
2
= Q
3
= 0; el modelo es
t
Y
#
= 42,5280 + 0,7576 t + 64,5555 = 107,0835 + 0,7576 t con t = 4 + 4
$
As, para cada trimestre (estacin del perodo), se obtiene un modelo del mismo tipo,
rectilneo con igual pendiente, en este caso, pero con distinta ordenada en el origen.
Esto se puede interpretar como que, tomando siempre como referencia el primer trimestre,
en el segundo el volumen de ventas aade a la funcin del tiempo 6,4674 unidades, en el
tercero el incremento es de 15,2782 y en el cuarto de 64,5555 unidades. Estos valores son,
evidentemente, los coeficientes de las variables categricas.
En consecuencia los coeficientes de las variables categricas representan la cantidad en
que una estacin, sistemticamente, supera (o no alcanza, segn sea el signo) el valor de la
primera estacin del perodo. Es decir, estos coeficientes son una forma de medir el
componente estacional.
Para evaluar la bondad del modelo, en la figura 4.2 se muestra la comparacin de los
valores medidos con los estimados a partir del modelo ajustado; se observa la buena
concordancia entre ambos.
La modelizacin tiene como objetivo principal el poder hacer previsiones para un futuro
prximo. En este caso se procede a calcular las previsiones para los prximos 2 aos, a
base de sustituir los valores del tiempo y de las variables categricas en el modelo obtenido.
Los resultados se muestran en la tabla 4.IV y en la figura 4.3.
40
70
100
130
0 4 8 12 16 20 24 t
Y
Fig. 4.2.- Datos reales ( ) y modelo ajustado ( )
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p47
Aqu se detecta la coherencia de la previsin con los datos histricos, siempre que no
cambie el modelo de comportamiento de la serie en el perodo previsto. Esto podra ocurrir,
por ejemplo, si hubiese una recesin econmica, la apertura de otro comercio de similares
caractersticas en las inmediaciones, un cambio de hbitos en la poblacin, una campaa
propagandstica con xito de la competencia, etc.
t 2 3 4
Y 42,5280 0,7576t 6,4674Q 15,2781Q 64,5555Q = + + + +
#
Ao t Q
2
Q
3
Q
4
t
Y
#
1996 25
26
27
28
0
1
0
0
0
0
1
0
0
0
0
1
61,4680
68,6930
78,2613
128,2963
1997 29
30
31
32
0
1
0
0
0
0
1
0
0
0
0
1
64,4984
71,7234
81,2917
131,3267
Tabla 4.IV.- Previsiones para 1996 y 1997
Y
40
90
140
0 4 8 12 16 20 24 28 32
t
1990 1995 1996 1997
datos previsiones
Fig. 4.3.- Datos, modelo y previsiones para los dos aos siguientes
Los autores, 2001; Edicions UPC, 2001.
p48 Series temporales
4.1 Comparacin del mtodo de descomposicin con el de variables categricas
Se han expuesto dos mtodos para la descomposicin de la serie y ambos se han aplicado
a un caso de modelo aditivo puro, es decir, en el que la estacionalidad no afecta a la
pendiente de la recta de tendencia. El de variables categricas es ms simple en cuanto a
manipulacin y clculos, aunque, si el perodo tiene muchas componentes, adquiere mayor
aparatosidad por el nmero de variables categricas que se manejan. El clsico, que
identifica los componentes del modelo por medio del uso de medias mviles, conduce a
resultados similares, en un caso en que se insiste que es aditivo puro; en casos ms
generales la descomposicin clsica no sera capaz de conseguir un buen modelo.
La comparacin de ambos, sobre el ejemplo desarrollado, se presenta en las figuras 4.4 y
4.5. La primera compara los resultados de los dos modelos dentro del perodo de recogida
de informacin; la segunda confronta los valores de los residuos obtenidos mediante los dos
sistemas. Ambos grficos confirman la gran concordancia de los resultados.
En las tablas 3.IX y 4.IV se han presentado las previsiones de ventas del material deportivo
para los ocho trimestres siguientes a la recogida de informacin, es decir, para los aos
1996 y 1997, siempre bajo el supuesto que el comportamiento de la serie no va a cambiar
en este perodo de tiempo. La figura 4.6 da idea de la casi coincidencia de las previsiones
para las dos formas de anlisis estudiadas.
40
70
100
130
0 4 8 12 16 20 24 t
V
a
l
o
r
e
s

m
o
d
e
l
i
z
a
d
o
s
Fig. 4.4.- Modelo segn la descomposicin clsica ( ) y las variables categricas ( )
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p49
-10
-5
0
5
10
15
-10 -5 0 5 10 15
R(descomp. clsica)
R
(
c
a
t
e
g

r
i
c
a
s
)

Fig. 4.5.- Residuos de la descomposicin frente a los del modelo en variables categricas
Ya que el objetivo del sistema clsico es descomponer la serie como un modelo aditivo, o
multiplicativo si fuese el caso, de tendencia, estacionalidad, ciclos y residuos, es necesario
identificar cada componente.
40
65
90
115
140
24 28 32
t
P
r
e
v
i
s
i
o
n
e
s
Fig. 4.6.- Previsiones para los dos aos siguientes segn la descomposicin clsica ( )
y las variables categricas ( )
Refirindonos slo a tendencia y estacionalidad, y considerando el modelo puramente
aditivo, como es el caso de los datos de las ventas de material deportivo, se tratar de pasar
del modelo en variables categricas
q p
i
t 0 i j j
i = 1 j = 2
= + +
Q t Y



L o s a u t o r e s , 2 0 0 1 ; E d i c i o n s U P C , 2 0 0 1 .
p50 Series temporales
a otro con sus componentes aisladas. Considerando el modelo aditivo, y suponiendo que los
ciclos, caso de existir, no sean identificables con los datos disponibles, tendremos
Y
t
=T
t
+ E
t
En este caso, despus de estabilizar la serie, se habr modelizado la tendencia como
q
i
t 0 i
i 1
T = a t
=
+

Debido a que es posible tener dos contadores del tiempo, uno asociado al momento de toma
de datos y otro que identifica la estacin a la que pertenece el dato, cualquier instante t
puede escribirse como t = s + k p = s + p
$
, con k = 0, 1, 2, y s = 1, 2,..., p, es decir, t
es un mltiplo del perodo, p, ms el indicador de la estacin, s. As, resulta
q
i
t t t 0 i s
i 1
Y = T E a t E
=
+ = + +

donde
p
s
s = 1
= 0
E

ya que se ha definido cada componente estacional como la diferencia


respecto a la media del perodo.
Se asume que, en caso de modelo aditivo puro, los coeficientes asociados a las potencias
del tiempo deben ser los mismos, sea cual sea el procedimiento empleado para su estudio;
en consecuencia, las posibles discrepancias entre los valores estimados por ambos
mtodos sern muy pequeas.
Desarrollando las ecuaciones del modelo clsico y del de variables categricas para s = 1,. .
. , p, igualndolas para cada s se obtiene
q q
i i
t 1 p 0 i 0 i 1
i 1 i 1
q q
i i
t 2 p 0 i 2 0 i 2
i 1 i 1
q q
i i
t p p 0 i p 0 i p
i 1 i 1
Y t a t E
Y t a t E
Y t a t E
= +
= =
= +
= =
= +
= =
= + = + +
= + + = + +
= + + = + +



$
$
$
A



y sumando miembro a miembro, resulta
p
j
p
j = 2
0 0 0 0 j
j = 2

p + = p a a = +
p


de donde se deduce la expresin que da directamente la tendencia global, T, en funcin de
los parmetros estimados en el modelo de variables categricas:
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p51
p
j
q
j = 2 i
t 0 i
i 1

T + + t
p
=
=


Para cualquier estacin, s, componente del perodo p, el modelo en variables categricas
puede escribirse como
q
i
t 0 i s
i 1
Y + t
=
= +

s = 1, , p t = s + p
$
Al ser la estacionalidad
s t s p t s p
E Y T
= + = +
=
$ $
, restando las dos ltimas expresiones de Y
t
y
T
t
resulta
p
j
j 2
s s

E =
p
=

Para el caso del ejemplo del material deportivo, p = 4, con variables categricas se obtuvo el
modelo
t 2 3 4
Y 42,5280 0,7576t 6,4674Q 15,2781Q 64,5555Q = + + + +
#
del cual resulta
4
j
j = 2

= 21,57525
4


. A partir de este modelo la ecuacin pura de la tendencia,
o esqueleto de la serie, es
p
j
q
j = 2 i
t 0 i
i 1

T + + t
p
=
=

= 42,5280 + 21,57525 + 0,7576 t = 64,10325 + 0,7576 t


Cuando, a partir de la estabilizacin por medias mviles, se estim el modelo de tendencia
(sistema clsico), el resultado fue
T
t
= 63,0065 + 0,8311 t
Es evidente que ambos resultados, procedentes de tcnicas de modelizacin distintas, son
muy parecidos; su similitud ya ha quedado puesta de manifiesto en las comparaciones
grficas de modelos , residuos y previsiones de las figuras 4.4, 4.5 y 4.6.
En cuanto a los valores de la estacionalidad, referidos a la media general, es decir, segn
los define el modelo clsico, se obtiene
E
1
= 0 21,57525 = 21,57525
E
2
= 6,46475 21,57525 = 15,10785
E
3
= 15,2781 21,57525 = 6,29715
E
4
= 64,5555 21,57525 = 42,98025
Los autores, 2001; Edicions UPC, 2001.
p52 Series temporales
Se comprueba que
4
s
s = 1
= 0
E

.
Estos valores, como era de esperar, son muy similares a los obtenidos por la
descomposicin clsica (captulo 3), que resultaron ser 20,6426; 15,5836; 6,5264 y
42,7526, respectivamente.
Como resumen, se puede reiterar la gran similitud de valores de los coeficientes del modelo
de tendencia y de los ndices estacionales obtenidos por los dos mtodos desarrollados.
Esta concordancia es buena para un caso como el que se acaba de estudiar, que se podra
etiquetar como modelo aditivo puro. Si se hubiera dado la circunstancia de una serie donde
la estacionalidad hubiese afectado a la tendencia de distinta forma en cada componente del
perodo, es decir, variando ya la pendiente, ya la ordenada en el origen, la descomposicin
clsica no hubiese conseguido modelizarla correctamente.
Es por todo ello que se puede afirmar que la modelizacin global con variables categricas
es un procedimiento mucho ms general para el estudio del comportamiento de una serie
temporal y la realizacin de previsiones.
4.2 Caso usuarios de un telfono
En la tabla 4.5 se exponen unos datos cronolgicos correspondientes al nmero de usuarios
de un telfono de atencin al cliente de lunes a viernes, recogidos durante las 12 primeras
semanas de puesta en marcha del servicio.
t Y t Y t Y t Y
1 99,30 16 117,66 31 127,52 46 149,66
2 65,27 17 52,67 32 30,42 47 34,13
3 48,27 18 63,96 33 92,71 48 118,31
4 20,58 19 40,85 34 60,22 49 64,06
5 75,17 20 76,12 35 88,61 50 106,09
6 104,76 21 116,48 36 136,60 51 150,28
7 58,96 22 52,86 37 32,16 52 25,74
8 67,18 23 79,80 38 104,76 53 114,62
9 28,44 24 44,25 39 60,62 54 74,64
10 83,71 25 88,39 40 93,53 55 106,34
11 121,13 26 125,34 41 142,92 56 149,02
12 51,52 27 46,45 42 33,34 57 29,06
13 64,30 28 80,05 43 103,53 58 121,42
14 25,60 29 50,67 44 68,86 59 76,33
15 76,50 30 94,03 45 92,50 60 114,29
Tabla 4.V.- Usuarios del telfono de atencin al cliente
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p53
En la figura 4.7 se muestra la evolucin de la demanda de utilizacin de este servicio, y se
observa que la simplicidad del mtodo clsico de considerar la serie aditiva o multiplicativa,
no est nada clara pues el patrn estacional ni se mantiene constante ni se amplifica
sistemticamente.
Es natural que, de haber estacionalidad, sta sea de perodo 5, correspondiente a posibles
diferencias de utilizacin de dicho servicio en los distintos das de la semana. La observacin
del grfico confirma esta estacionalidad. En cuanto a la tendencia, tampoco se ve muy claro si
la hay; si se observan los datos del primer da de cada semana (lunes) parece que haya un
crecimiento sostenido de la demanda, mientras que viendo el comportamiento de los martes
(tabla 4.V) la tendencia es a una disminucin. Si slo se dispusiese del mtodo clsico de
descomposicin de la serie sera difcil analizar esta situacin, ya que la tendencia general, all
definida como esqueleto de la serie, parece mantenerse ms o menos constante.
0
40
80
120
160
0 20 40 60
t
Y
Fig. 4.7.- Evolucin cronolgica de la demanda
Aplicando la sistemtica de anlisis de variables categricas, corresponde definir 4
variables, Q
2
, Q
3
, Q
4
y Q
5
, que identificarn cada uno de los cinco das de la semana. En la
tabla 4.VI, se muestra un fragmento de los valores de dichas variables asociados a los datos
disponibles.
t Y Q2 Q3 Q4 Q5
1 99,3 0 0 0 0
2 65,27 1 0 0 0
3 48,27 0 1 0 0
4 20,58 0 0 1 0
5 75,17 0 0 0 1
6 104,76 0 0 0 0
7 58,96 1 0 0 0
8 67,18 0 1 0 0
9 28,44 0 0 1 0
10 83,71 0 0 0 1
11 121,13 0 0 0 0
12 51,52 1 0 0 0
... ... ... ... ... ...
Tabla 4. VI.- Variables categricas
Los autores, 2001; Edicions UPC, 2001.
p54 Series temporales
El modelo inicial que debe plantearse es del tipo
0 1 2 2 3 3 4 4 5 5 2 2 3 3 4 4 5 5
Y t Q Q Q Q Q t Q t Q t Q t = + + + + + + + + + +
y los resultados de la estimacin mnimo-cuadrtica de los coeficientes se muestran en la
tabla 4.VII. De ella se deduce que el trmino t=Q
4
no es significativo (p-val > 0,05) y puede
ser eliminado del modelo. Al recalcular el nuevo modelo se obtienen los resultados
mostrados en la tabla 4.VIII.
nu S.C. C.M. F p-val
Regresin 9 73631,982 8181,331 355,132 0,000
Residuos 50 1151,873 23,037
Total 59 74783,855
Coef. Error tpico t p-val
Ord. Origen 101,580 2,675 37,978 0,000
Q2 -38,364 3,832 -10,012 0,000
Q3 -53,757 3,882 -13,849 0,000
Q4 -83,296 3,933 -21,179 0,000
Q5 -31,512 3,985 -7,908 0,000
t 0,941 0,080 11,718 0,000
t*Q2 -1,636 0,114 -14,408 0,000
t*Q3 0,385 0,114 3,387 0,001
t*Q4 0,106 0,114 0,935 0,354
t*Q5 -0,288 0,114 -2,539 0,014
R^2 = 0,9846
Tabla 4.VII.- Resultados del modelo lineal inicial
nu S.C. C.M. F p-val
Regresin 8 73611,831 9201,479 400,398 0,000
Residuos 51 1172,023 22,981
Total 59 74783,855
Coef. Error tpico t p-val
Ord. Origen 100,067 2,127 47,038 0,000
Q2 -36,851 3,469 -10,622 0,000
Q3 -52,244 3,524 -14,824 0,000
Q4 -80,110 1,964 -40,780 0,000
Q5 -29,999 3,637 -8,247 0,000
t 0,994 0,057 17,529 0,000
t*Q2 -1,689 0,098 -17,198 0,000
t*Q3 0,331 0,098 3,376 0,001
t*Q5 -0,341 0,098 -3,476 0,001
R^2 = 0,9843
Tabla 4.VIII.- Resultados del modelo lineal definitivo
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p55
El modelo que explica el comportamiento de la serie presenta un elevado grado de ajuste
(R
2
= 98,43%) y, segn los coeficientes de la tabla 4.VIII, toma la expresin
t
Y
#
= 100,07 36,85 Q
2
52,24 Q
3
80,11 Q
4
30 Q
5
+ 0,99 t 1,69 t Q
2
+ 0,33 t Q
3
0,34 t Q
5
La figura 4.8 presenta el modelo ajustado junto a los datos, y la figura 4.9 los residuos del
modelo. Se observa que la mayora de los valores estn en el intervalo 4 unidades, y slo
en algn caso la discrepancias alcanza 10 unidades; ello confirma el buen ajuste.
Y
0
40
80
120
160
200
0 20 40 60 t
Fig. 4.8.- Datos experimentales ( ) y modelo ajustado ( )
-12
-8
-4
0
4
8
12
0 20 40 60
t
R
Fig. 4.9.- Residuos del modelo: R = Y Y
#
La interpretacin del modelo obtenido, se puede hacer determinando la ecuacin de
previsin asociada a cada uno de los das de la semana, es decir, a cada componente de la
estacin. A ttulo de ejemplo, los modelos para el lunes y el viernes son:
Los autores, 2001; Edicions UPC, 2001.
p56 Series temporales
Lunes: s = 1 Q
2
= Q
3
= Q
4
= Q
5
= 0 Y
#
= 100,07 + 0,99 t con t =5
$
+1
Viernes: s = 5 Q
2
= Q
3
= Q
4
= 0 Q
5
= 1 Y
#
= 70,07 + 0,65 t con t =5
$
+5
En la figura 4.10, se puede observar cada una de las cinco rectas que componen el modelo,
sobre el fondo de los datos experimentales. Cada recta, a la derecha del grfico, lleva el
indicador estacional que le corresponde (lunes: s =1; martes: s = 2). De la ecuacin del
modelo general y del estudio de este grfico se puede concluir que el lunes y el jueves
tienen la misma tendencia (las rectas 1 y 4 son paralelas); sin embargo el lunes tiene,
sistemticamente, un mayor nmero de usuarios que el jueves. Esta discrepancia constante
es la diferencia de ordenadas de ambas rectas, o sea el coeficiente de Q
4
, que en este caso
es igual a 80,11. La tendencia comn indica un aumento sostenido de usuarios que se
evala en un incremento de 0,99 usuarios al da (coeficiente de t en las rectas 1 y 4).
0
40
80
120
160
0 20 40 60
Y
1
3
5
4
2
t
Fig. 4.10.- Modelos asociados a cada da de la semana
En cuanto a los mircoles y viernes (rectas 3 y 5), se puede decir que tienen un
comportamiento similar. En los primeros das haba algo ms de usuarios el viernes que el
mircoles; sin embargo, dicho nmero ha aumentado en ambos, pero con mayor velocidad
el mircoles, de forma que actualmente ste ya supera al viernes.
Especial atencin merece el martes (recta 2), ya que inicialmente tena un nmero de
usuarios situado ms o menos en el promedio de los otros das, pero ha sufrido un
decrecimiento progresivo que actualmente lo sita en un valor muy inferior a los dems das
de la semana, los cuales, en mayor o menor grado, han presentado un incremento de
demanda del servicio.
Est claro que, en la prctica, una situacin como sta requerira de un estudio en
profundidad de las causas que han conducido a esta situacin: quizs la persona que
atiende la lnea no es la misma, o hay mayores dificultades para establecer comunicacin y
el pblico deja de llamar los martes,...
La obtencin del modelo tiene como principal objetivo el poder hacer previsiones del
comportamiento de la demanda del servicio durante los prximos das, a fin de programar un
Los autores, 2001; Edicions UPC, 2001.
Modelizacin con variables categricas p57
aumento del nmero de lneas telefnicas, del nmero de personas que atienden a los
usuarios, plantearse una redistribucin en el tiempo, etc.
La tabla 4.IX muestra las previsiones para las dos semanas prximas, junto a los valores del
tiempo y de las variables categricas, necesarios para ser sustituidos en el modelo general.
t Q2 Q3 Q4 Q5 Y prevista
61 0 0 0 0 160,686
62 1 0 0 0 20,129
63 0 1 0 0 131,312
64 0 0 1 0 83,557
65 0 0 0 1 112,478
66 0 0 0 0 165,655
67 1 0 0 0 16,654
68 0 1 0 0 137,938
69 0 0 1 0 88,526
70 0 0 0 1 115,741
Tabla 4.IX.- Previsiones para dos semanas
En la figura 4.11 se pueden observar los valores de las previsiones como extrapolacin del
modelo ajustado sobre los datos disponibles, constatndose la gran disminucin del nmero
de usuarios del martes.
0
30
60
90
120
150
180
0 10 20 30 40 50 60 70 t
Y
Fig. 4.11. - Datos ( ), modelo ( --- ) y previsiones (1)
Dichas previsiones sern vlidas siempre que se mantenga el modelo de comportamiento
que han puesto de manifiesto los datos disponibles. Es evidente que si se encontrase la
causa de la disminucin de llamadas producida en los martes, y se corrigiese, sera
necesario llevar a cabo una nueva recogida de informacin para elaborar los modelos
correspondientes y hacer previsiones en la nueva situacin.
Los autores, 2001; Edicions UPC, 2001.
p58 Series temporales
5 AUTOCORRELACIN
En este captulo se presenta una herramienta de anlisis, el correlograma, o representacin
grfica de la funcin de autocorrelacin, que tiene una doble utilidad. Por una parte, puede
servir para confirmar la presencia de estacionalidad y determinar su perodo; por otra, indica
cuntas previsiones son admisibles, a partir del ltimo tiempo de recogida de informacin.
El concepto de autocorrelacin es bien simple; supongamos que se dispone de la serie
cronolgica Y
1
, Y
2
,... , Y
1+k
,... , Y
N
, y se desplaza dicha serie k unidades de tiempo; se
pueden formar las parejas (Y
1
; Y
1+k
), (Y
2
; Y
2+k
), (Y
3
; Y
3+k
),..., (Y
Nk
; Y
N
).
El coeficiente de correlacin entre ambas series, es decir, de las parejas citadas, se denota
por
k
y recibe el nombre de coeficiente de autocorrelacin de orden k; el desplazamiento k
tambin se denomina retardo, y representando grficamente
k
en funcin del retardo k, se
obtiene el autocorrelograma de la serie. De la estructura del planteamiento se deduce que

k
=

k
.
5.1 Correlograma
Un valor no nulo de
k
indica que existe correlacin entre informaciones separadas k
unidades de tiempo, es decir, la historia se transmite k unidades de tiempo ms all. En
consecuencia, si el ltimo valor del tiempo del que se dispone de datos es el T, ser
admisible hacer previsiones para un tiempo igual a T+k. Evidentemente, si
k
fuese nulo,
sera inadmisible una prediccin para T+k, ya que los datos disponibles no transmiten
ninguna informacin relevante a una distancia como la considerada.
Sea que se dispone de una serie cronolgica de datos y
1
, y
2
,..., y
t
,..., y
N
, para elaborar el
correlograma o grfico de la funcin de autocorrelacin. Se estiman las siguientes
caractersticas:
Media:
N
i
i 1
y
m y
N
=
= =

Autocovariancia:
N k
i i k
i 1
k
(y y) (y y)

+
=

=

k = 0, 1,..., N1
Autocorrelacin:
k
k k
0

= =

Para poder estimar la autocovariancia,


k
, el nmero de componentes de la serie debe ser tal
que N > k+1, y es recomendable N 50 y k N/4.
Los autores, 2001; Edicions UPC, 2001.
Autocorrelacin p59
Para identificar los coeficientes de autocorrelacin que sean significativamente distintos de
cero, es necesario estudiar el comportamiento estadstico de los estimadores. Bartlett ha
estudiado el estadstico r
k
y, bajo el supuesto de que
k
= 0 para todo k K, obtiene que
K 1
2
k i
(K 1)
1
V(r )
N


k K
al sustituir
i
por su estimador, r
i
, y, dado que
0
= 1 y
i
=

i
, resulta que la estimacin de la
variancia de r
k
es igual a
k
K 1
2
k i K 1
2 (K 1)
k i
1
1
V(r ) k K K 1
N 1

V(r ) r
1 N
V(r ) 1 2 r k K K 1
N


'
_

+ >

Anderson indica que para valores de k tales que


k
= 0 y N suficientemente grande, r
k
se
distribuye aproximadamente N(0; V(r
k
)). De esta forma, con una probabilidad del orden del
95%, si
k
= 0, su estimador r
k
se encontrar en el intervalo 2 S(r
k
), donde S(r
k
) representa
la desviacin tipo estimada de r
k
, es decir,
k k

S(r ) V(r ) .
El intervalo t 2 S(r
k
) se denomina intervalo de no significacin de
k
, y es el conjunto de
valores que puede tomar r
k
para que, con un riesgo del 5%, se pueda admitir la ausencia de
correlacin entre valores de la serie, desplazados k unidades de tiempo. Por todo ello, al
calcular la funcin de autocorrelacin de una serie, es bueno representarla grficamente
junto al intervalo 2 S(r
k
), con objeto de considerar nicamente como coeficientes de
autocorrelacin no nulos aquellos cuya estimacin est fuera del citado intervalo.
Las autocorrelaciones suelen disponerse matricialmente, lo que da lugar a la matriz de
autocorrelaciones P
N
, simtrica, definida positiva, cuya estructura es
1 2 N - 1
1 1 N - 2
N
2 1 N - 3
N - 1 N - 2 N - 3
1 . . . . .
1 . . . . .
1 . . . . . =
P
. . . . . . . . . . . . . . . . .
. . . . . 1
_






,




Como aplicacin se va a analizar la serie cronolgica de la tabla 5.I, que corresponde al
valor de los stocks en I.C.I. (Serie D* de Time Series Analysis and Forecasting, O.D.
Anderson, ed. Butterworths, 1977). Su evolucin se muestra en la figura 5.1.
Los autores, 2001; Edicions UPC, 2001.
p60 Series temporales
t Y t Y t Y t Y t Y t Y
1 304 19 278 37 282 55 273 73 291 91 282
2 303 20 277 38 283 56 272 74 288 92 286
3 307 21 279 39 279 57 273 75 288 93 286
4 299 22 278 40 280 58 271 76 290 94 287
5 296 23 270 41 280 59 272 77 293 95 284
6 293 24 268 42 279 60 271 78 288 96 283
7 301 25 272 43 278 61 273 79 289 97 286
8 293 26 273 44 283 62 277 80 291 98 282
9 301 27 279 45 278 63 274 81 293 99 287
10 295 28 279 46 270 64 274 82 293 100 286
11 284 29 280 47 275 65 272 83 290 101 287
12 286 30 275 48 273 66 280 84 288 102 292
13 286 31 271 49 273 67 282 85 287 103 292
14 287 32 277 50 272 68 292 86 289 104 294
15 284 33 278 51 275 69 295 87 292 105 291
16 282 34 279 52 273 70 295 88 288 106 288
17 278 35 283 53 273 71 294 89 288 107 289
18 281 36 284 54 272 72 290 90 285
Tabla 5.I.- Valor de los stocks en I.C.I
260
270
280
290
300
310
0 40 80 120 t
Y
Fig. 5.1.- Evolucin de la serie de la tabla 5.I
En la tabla 5.II se presenta el detalle del clculo de las autocorrelaciones para los casos de
k =1 y k = 2, de los valores de la tabla 5.I. En primer lugar es necesario calcular la media de
todos los datos
1
m = y = ( 304 + . . . + 295 ) = 299,2
10
Los autores, 2001; Edicions UPC, 2001.
Autocorrelacin p61
t 1 2 3 4 5 ... 105 106 107
y 304 303 307 299 296 291 288 289
k = 0
y - y 20,44 19,44 23,44 15,44 12,44 ... 7,44 4,44 5,44
y 304 303 307 299 ... 294 291 288
k = 1
y - y 20,44 19,44 23,44 15,44 ... 10,44 7,44 4,44
y 304 303 307 ... 292 294 291
k = 2
y - y 20,44 19,44 23,44 ... 8,44 10,44 7,44
Tabla 5.II.- Detalle del clculo de las autocorrelaciones de la tabla 5.I
Las estimaciones se obtienen como
2 2 107
2
0 i
1
1 20,44 ... 5,44
= ( - y = 74,695 y )
107 107
+ +
=

107
1 i i - 1
2
1 19,44 20,44 ... 5,44 4,44
= ( - y ) ( - y ) 66,123 y y
107 107
+ +
= =

1
1 1
0
66,123
r 0,885
74,695
= = = =

107
2 i i - 2
3
1 23,44 20,44 ... 5,44 7,44
= ( - y ) ( - y ) 59,775 y y
107 107
+ +
= =

2
2 2
0
59,775
r 0,800
74,695
= = = =

etc.
Segn Bartlett las desviaciones tipo estimadas para r
1
y r
2
son:
1
1 1
S(r ) 0,097
N 107
= = =
( )
2
2
2 1
1 1 2 0,885
S(r ) 1 2 r 0,155
N 107
+
= + = =
etc.
Los autores, 2001; Edicions UPC, 2001.
p62 Series temporales
Y los intervalos 2 S(r
k
) son, respectivamente, 0,194 y 0,310 para k=1 y k=2. En
consecuencia, con un riesgo del 5%,
1
y
2
pueden ser significativamente distintos de cero.
Analizando los 107 valores de la serie completa para k = 1, 2,..., 10, se obtienen los valores
mostrados en la tabla 5.III y presentados en la figura 5.2. De estos resultados, se verifica
que a partir de k = 7 ya se puede considerar
k
como nulo, es decir, no es admisible hacer
previsiones separadas en ms de 7 unidades de tiempo del ltimo momento de recogida de
datos.
k 1 2 3 4 5 6 7 8 9 10
r
k
0,89 0,80 0,70 0,63 0,58 0,55 0,48 0,40 0,31 0,23
S(r
k
) 0,10 0,15 0,19 0,21 0,23 0,24 0,25 0,26 0,27 0,27
Tabla 5.III.- Valores de las autocorrelaciones y sus desviaciones tipo
-1
-0,5
0
0,5
1
k
r
k
Fig. 5.2.- Correlograma
Con los valores de la tabla 5.III, se puede escribir la matriz de autocorrelaciones que, para k
=3, adquiere la siguiente forma:
3
1 0,885 0,800 0,699
0,885 1 0,885 0,800
=
P
0,800 0,885 1 0,885
0,699 0,800 0,885 1







L o s a u t o r e s , 2 0 0 1 ; E d i c i o n s U P C , 2 0 0 1 .
Autocorrelacin p63
5.2 Interpretacion de los correlogramas
En la figura 5.3 se muestran los correlogramas de las series analizadas hasta ahora.
El primero, que corresponde a los datos de la figura 1.2 de la evolucin del ndice IBEX35,
muestra que slo son significativos los tres primeros coeficientes de autocorrelacin; por
tanto, las previsiones dejan de ser vlidas a partir de tres unidades de tiempo despus del
ltimo dato. Es decir, lo que ocurra en un instante se transmite hasta tres unidades de
tiempo ms adelante.
El segundo, de los datos de la tabla 3.I y de la figura 3.1 sobre las ventas trimestrales de
material deportivo, confirma la estacionalidad de perodo cuatro, ya que cada cuatro barras
de autocorrelacin se repite la misma estructura de comportamiento. En este caso es
posible hacer previsiones a cuatro trimestres vista, ya que para k = 4 el coeficiente de
autocorrelacin es significativamente distinto de cero, aunque no lo sean los de k = 1, 2 y 3.
Este hecho se puede interpretar como que la informacin de un trimestre se transmite
directamente hasta una distancia temporal de cuatro trimestres, sin que afecte el
comportamiento de los tres trimestres intermedios. As, por ejemplo, una vez conocidas las
ventas de invierno, se puede hacer la previsin para el invierno prximo puesto que lo que
ocurra en primavera, verano y otoo no afectar al invierno siguiente.
El tercero y el cuarto corresponden, respectivamente, a las temperaturas medias mensuales
(tabla 3.X y figura 3.6), y a los usuarios mensuales de un transporte pblico (tabla 3.XIV y
figura 3.12). En ambos casos se confirma la estacionalidad de perodo 12, y se pueden
hacer previsiones a 18 meses para la temperatura, y a 13 para los usuarios. A diferencia del
segundo caso, en el ltimo la informacin de un mes afecta directamente al resto de meses
del mismo grupo de 12; es decir, si bien es cierto que se puede predecir el nmero de
usuarios para dentro de un ao, lo que ocurra en los meses venideros puede afectar esta
previsin; por tanto interesa incorporar los datos disponibles lo ms rpidamente posible al
modelo, para una mayor fiabilidad de las previsiones.
El ltimo de los correlogramas es el de los usuarios de un telfono de atencin al cliente,
(tabla 4.V y figura 4.7). Adems de confirmar la estacionalidad de perodo 5, pone de
manifiesto que es aceptable hacer previsiones para los prximos 10 das, es decir, a dos
semanas vista.
Los autores, 2001; Edicions UPC, 2001.
p64 Series temporales
IBEX DEPORTE
-1
-0,5
0
0,5
1
k
r
k
-1,0
-0,5
0,0
0,5
1,0
k
r
k
TEMPERATURAS USUARIOS TRANSPORTE
-1
-0,5
0
0,5
1
k
r
k
-1,0
-0,5
0,0
0,5
1,0
k
r
k
USUARIOS TELFONO
-1
-0,5
0
0,5
1
k
r
k
Fig. 5.3.- Correlogramas
Los autores, 2001; Edicions UPC, 2001.
Otras tcnicas de previsin: ponderacin exponencial p65
6 OTRAS TCNICAS DE PREVISIN: PONDERACIN EXPONENCIAL
Cuando la serie presenta componente estacional y tendencia que se mantienen de forma
sostenida a lo largo de todo el perodo de recogida de datos, se han expuesto dos formas de
modelizarla y poder hacer previsiones: la descomposicin clsica y las variables
categricas.
Sin embargo, son frecuentes las situaciones en que la tendencia, caso de existir, puede ser
difcil modelizarla a travs de un simple modelo polinmico de menor o mayor grado. Podra
entonces pensarse en un modelo de evolucin que cambiase a lo largo del tiempo; en estos
casos las tcnicas asociadas a la metodologa de la ponderacin exponencial son tiles para
hacer previsiones sobre la evolucin futura.
6.1 Suavizado exponencial
La ponderacin exponencial, o suavizado exponencial, es otra tcnica destinada tambin a
estabilizar la serie, eliminando en lo posible la influencia del componente aleatorio. Para ello
se construye una nueva serie, la serie suavizada
t
S , a partir de los datos iniciales,
t
Y , de
manera que
t t t 1
S Y ( 1 ) S

= + con 0 < < 1


Para que la serie suavizada quede definida, es necesario concretar los valores de S
0
, que
generalmente se considera igual a Y
1
, y el del coeficiente de ponderacin . En la seleccin
del valor de se pueden emplear distintos criterios de minimizacin de errores, que se
expondrn a continuacin.
Sustituyendo repetitivamente S
t-1
, S
t-2
,... por su expresin de S
t
, se obtiene
2 i
t t t 1 t 2 t i
t 1 t
1 0
S Y (1 )Y (1 ) Y (1 ) Y
(1 ) Y (1 ) S

= + + + + +
+ +
@
@
El valor de S
t
es la previsin para el tiempo siguiente, es decir,
t 1 t
Y S
+
=
#
.
El anlisis de la expresin anterior permite interpretar este tipo de suavizado, de forma que
el valor de Y previsto para el perodo t+1, es decir S
t
, se obtenga como promedio ponderado
de los valores reales que ha presentado la serie cronolgica desde el inicio de la recogida
de informacin. La discrepancia entre los valores obtenidos y los previstos, Y
t+1
S
t
, es
atribuible en parte al componente aleatorio y, posiblemente, a cambios bruscos en el
comportamiento de la serie.
El coeficiente de ponderacin juega el siguiente papel: cuanto mayor sea su valor, tanto
ms peso se dar a los valores recientes, en detrimento de los antiguos; mientras que
valores de prximos a cero dan gran peso a la historia y poca importancia a los valores
prximos.
Los autores, 2001; Edicions UPC, 2001.
p66 Series temporales
As, si la serie se mantiene estable, sern interesantes valores pequeos del coeficiente de
ponderacin ya que amortiguarn fuertemente la oscilacin aleatoria, mientras que si la
serie presentara cambios bruscos, la serie suavizada tardara mucho en detectarlos si su
fuese pequea, mientras que respondera prontamente a ellos con valores altos del
coeficiente .
Analizando la expresin del valor suavizado, para distintos valores de , se puede escribir,
por ejemplo,
= 0,10 Y
#
5
= S
4
= 0,10 Y
4
+ 0,09 Y
3
+ 0,081 Y
2
+ 0,729 Y
1
= 0,50 Y
#
5
= S
4
= 0,50 Y
4
+ 0,25 Y
3
+ 0,125 Y
2
+ 0,125 Y
1
= 0,90 Y
#
5
= S
4
= 0,90 Y
4
+ 0,09 Y
3
+ 0,009 Y
2
+ 0,001 Y
1
Es decir, con un valor del factor de ponderacin de 0,10, la previsin para t = 5 est
constituida por un 10% del valor observado en t = 4, un 9% del de t = 3, un 8,1% del de t = 2
y un 72,9 % del de t = 1; o sea, con un valor pequeo de , la previsin est constituida
mayoritariamente por el valor ms antiguo.
Cuando es igual a 0,50, los pesos aplicados a cada valor recogido estn ms
uniformemente repartidos y, cuando es grande, por ejemplo 0,90, el mayor componente de
la previsin es el ltimo valor observado; los dems tendrn un valor de ponderacin tanto
ms pequeo cuanto ms alejados estn en el tiempo.
El suavizado exponencial puede verse como un mtodo alternativo a las medias mviles,
con sus ventajas e inconvenientes.
Entre las primeras hay que citar que con la ponderacin exponencial no se pierde ninguna
informacin, al contrario que con las medias mviles, pues cuanto mayor era la longitud del
perodo a promediar, tanta ms informacin se perda, en el inicio y en el fin de la serie.
Adems una serie con cambios de tendencia, ms o menos bruscos, se puede modelizar
por suavizado exponencial y no podra hacerse ni por descomposicin ni por variables
categricas. Por el contrario, si la serie presenta estacionalidad con las medias mviles,
siempre que se escoja correctamente el perodo, sta desaparece totalmente y da lugar a
una serie estabilizada que permite modelizar directamente la tendencia, hecho que no
ocurre con la ponderacin exponencial simple, que no es capaz de suavizar la oscilacin
debida a la estacionalidad.
Para solucionar este inconveniente, se han desarrollado tcnicas basadas en el suavizado
exponencial, que permiten incorporar un modelo de tendencia o bien una componente
estacionaria; stas son las tcnicas de Brown, para el primer caso, o de Winters para el
segundo.
Los autores, 2001; Edicions UPC, 2001.
Otras tcnicas de previsin: ponderacin exponencial p67
6.2 Seleccin del factor de ponderacin
Tal como se ha expuesto, en funcin del valor de , se puede dar mayor o menor peso a la
historia, y detectar con ms o menos rapidez cambios bruscos en la serie; es por ello que la
seleccin del valor ms adecuado para el factor de ponderacin es crucial en el xito de la
modelizacin de la serie y la previsin de valores futuros.
Todos los mtodos utilizados para esta seleccin se basan en minimizar alguna funcin de
los errores de ponderacin.
Recordando que
t t 1
Y S

=
%
, los errores ms destacables son:
n Error medio: promedio de los errores de previsin; atendiendo a que para hacer
previsiones hay que disponer de datos, el primer valor previsto posible ser el de t = 2:
n
t t
t=2
( - )
S Y
M E =
n - 1

n Error cuadrtico medio: promedio de los cuadrados de los errores de previsin:


n
2
t t
t=2
( - ) S Y
M S E =
n - 1

n Error absoluto medio: promedio de los valores absolutos de los errores de previsin:
n
t t
t=2
-
S Y
M A E =
n - 1

n Media del porcentaje del error: promedio de los porcentajes de los errores relativos de
previsin:
n
t t
t=2 t
Y Y
100
Y
M P E =
n - 1

%
n Media del porcentaje de error absoluto: promedio de los porcentajes de los valores
absolutos de los errores de previsin relativos:
n
t t
t t=2
-
Y Y
x 100
Y
M A P E =
n - 1

%
Hay que insistir en que en una serie en la que el tiempo es t = 1, 2,..., n, el suavizado
exponencial no ofrece ninguna previsin para t = 1, y, por tanto, no existe error de previsin
Los autores, 2001; Edicions UPC, 2001.
p68 Series temporales
en este punto; consecuentemente, en este caso los errores siempre son promedios de n 1
valores.
De los errores expuestos, aquellos que no toman valor absoluto, ME y MPE, tienen poco
inters ya que, a causa de la compensacin de valores positivos y negativos, pueden dar
valores de los promedios muy prximos a cero aun cuando existan errores de previsin muy
grandes. En general, se selecciona aquel valor de para el cual los valores del error
absoluto medio y del cuadrtico medio, MAE y MSE, alcancen los valores ms bajos.
Como ejemplo consideremos los datos de la tabla 6.I, serie cronolgica de 50 valores, cuya
representacin grfica puede verse en la figura 6.1.
t Y
t
t Y
t
t Y
t
t Y
t
t Y
t
1
2
3
4
5
6
7
8
9
10
9,958
10,096
11,552
9,113
13,898
11,487
11,114
9,505
17,934
12,339
11
12
13
14
15
16
17
18
19
20
16,510
12,674
17,504
13,462
16,945
18,653
18,942
15,084
16,568
20,733
21
22
23
24
25
26
27
28
29
30
26,267
20,401
18,748
20,800
21,683
27,069
23,728
24,890
26,132
24,663
31
32
33
34
35
36
37
38
39
40
25,217
24,653
28,062
27,317
26,122
29,837
28,854
27,129
30,194
34,104
41
42
43
44
45
46
47
48
49
50
28,448
35,726
30,602
31,011
31,732
31,538
32,175
35,543
35,534
37,336
Tabla 6.I.- 50 valores de una serie cronolgica
0
10
20
30
40
0 10 20 30 40 50 t
Y
Fig. 6.1.- Evolucin cronolgica de los datos de la tabla 6.I
Los autores, 2001; Edicions UPC, 2001.
Otras tcnicas de previsin: ponderacin exponencial p69
Observando el grfico, difcilmente se aprecia una estacionalidad, mientras que es evidente
una tendencia creciente y casi seguramente lineal. La figura 6.2 es el correlograma de la
serie que pone de manifiesto la ausencia de estacionalidad, junto con una autocorrelacin
significativa hasta un retardo de 4 unidades de tiempo.
-1,0
-0,5
0,0
0,5
1,0
k
r
k
Fig. 6.2.- Correlograma de la serie de la tabla 6.I
Aplicando la ponderacin exponencial a estos datos, en funcin del valor de , los errores
evolucionan segn muestra la tabla 6.II.
ME MSE MAE MPE MAPE
0,100 4,278 25,408 4,363 17,577 18,494
0,150 3,092 15,628 3,196 12,719 13,812
0,200 2,416 11,731 2,627 9,817 11,622
0,250 1,984 9,904 2,351 7,896 10,632
0,300 1,685 8,975 2,217 6,531 10,214
0,350 1,467 8,496 2,174 5,510 10,157
0,400 1,300 8,270 2,171 4,716 10,271
0,450 1,169 8,200 2,183 4,079 10,449
0,500 1,062 8,233 2,214 3,556 10,696
0,550 0,974 8,341 2,251 3,119 10,960
0,600 0,899 8,507 2,289 2,746 11,233
0,650 0,835 8,722 2,330 2,425 11,508
0,700 0,780 8,981 2,371 2,145 11,786
0,750 0,731 9,283 2,418 1,898 12,082
0,800 0,689 9,628 2,470 1,677 12,396
0,850 0,651 10,019 2,525 1,479 12,723
0,900 0,617 10,461 2,581 1,299 13,052
0,950 0,586 10,961 2,643 1,133 13,406
Tabla 6.II.- Evolucin de los errores en funcin de .
Los autores, 2001; Edicions UPC, 2001.
p70 Series temporales
Analizando detenidamente la evolucin de errores mostrada en la citada tabla, se observa
que, tanto el error medio (ME) como la media del porcentaje del error (MPE) disminuyen al
aumentar , mientras que los otros errores (MSE, MAE y MAPE) alcanzan el mnimo para
el intervalo 0,35 0,45. Dado que el error cuadrtico medio (MSE) es el que, en
general, presenta mejores propiedades, se va a tener en cuenta para seleccionar
definitivamente el coeficiente de ponderacin; as, en el caso del ejemplo, se va a trabajar
con = 0,45.
Para entender mejor lo que representa la seleccin de uno u otro valor de , en la figura 6.3
se pueden comparar las evoluciones de las series ponderadas respecto a los datos
cronolgicos para distintos valores del parmetro de ponderacin.
=0,10 =0,30
0
10
20
30
40
0 10 20 30 40 50 60 t
0
10
20
30
40
0 10 20 30 40 50 60 t
=0,45 =0,95
0
10
20
30
40
0 10 20 30 40 50 60
t
0
10
20
30
40
0 10 20 30 40 50 60
t
Fig. 6.3.- Serie original () y suavizada ( ) para distintas .
Directamente se observa que, en este caso, para valores pequeos de la serie suavizada
va por detrs de la real, es decir, tarda mucho en responder a la evolucin. Sin embargo,
cuando = 0,95, la suavizada est totalmente ligada a la oscilacin aleatoria de la serie, es
decir, la previsin para el tiempo inmediato siguiente es prcticamente igual al ltimo valor
medido. Cuando = 0,45, valor para el que ha resultado un error cuadrtico medio mnimo,
la serie suavizada exponencialmente, sigue ms claramente el esqueleto de la serie
cronolgica y queda amortiguada la oscilacin aleatoria.
Los autores, 2001; Edicions UPC, 2001.
Otras tcnicas de previsin: ponderacin exponencial p71
La figura 6.4 muestra los residuos, R
t
= Y
t

t
Y
#
= Y
t
S
t-1
, para tres valores de . En ella se
observa que para = 0,10 la mayora de los residuos son positivos, es decir, la previsin va
por detrs del valor real, mientras que para = 0,45 estn, casi siempre, entre los de =
0,10 y los de = 0,90, es decir, son ms prximos a cero, y por tanto, ms pequeos.
-6
0
6
12
0 10 20 30 40 50 t
R
Fig. 6.4.- Residuos en funcin de . = 0,10 (

) = 0,45 ( ) = 0,90 (

)
Para el valor del coeficiente de ponderacin seleccionado ( = 0,45), se calculan los valores
de la serie suavizada, (S
t
= 0,45 Y
t
+ 0,55 S
t-1
), las previsiones (
t
Y
#
= S
t-1
) y los residuos
(R
t
=Y
t

t
Y
#
), cuyos valores se muestran parcialmente en la tabla 6.III. En dicha tabla figuran
tambin los valores previstos para los tiempos 51, 52 y 53, de los que ya no se dispone de
datos.
La previsin para cualquier valor de t = 51, se ha calculado como
50 50 49 51
= = + ( 1- ) = 0,45 x 37,3364 + 0,55 x 34,4142 = 35,7292
S S Y
Y

La estimacin para cualquier otro valor de t superior a ste, se tendr que hacer tomando
como Y
t
el valor de la previsin, ya que no se dispone de datos reales. As
50 50 49 51
= = + ( 1- ) = 0,45 x 37,3364 + 0,55 x 34,4142 = 35,7292
S S Y
Y

es decir, con este sistema la previsin es idntica para cualquier tiempo futuro, tal como se
aprecia en las ltimas filas de la tabla 6.III. Ello evidencia que la previsin no concuerda con
la evolucin cronolgica presente (figura 6.5), aunque dentro del perodo estudiado la serie
suavizada sigue de forma muy razonable a los datos disponibles.
Los autores, 2001; Edicions UPC, 2001.
p72 Series temporales
t Y
t
S
t t
Y
#
R
t
1
2
3

48
49
50
9,958
10,096
11,552

35,543
35,534
37,336
9,958
10,020
10,709

33,498
34,414
35,729

9,958
10,020

31,825
33,498
34,414

0,138
1,532

3,718
2,036
2,922
51
52
53

35,729
35,729
35,729
35,729
35,729
35,729

Tabla XXIII.- Datos, previsiones y residuos


0
10
20
30
40
0 5 10 15 20 25 30 35 40 45 50 55
t
Fig. 6.5.- Suavizado exponencial ( ) y previsin ( 1 ), con = 0,45
Aqu se manifiesta la necesidad de incorporar de alguna forma la tendencia al suavizado
exponencial, tal como hace el mtodo de Brown que se expondr en el apartado siguiente.
6.3 Mtodo de Brown
Cuando la serie cronolgica presenta tendencia, el suavizado exponencial simple no es
capaz de incorporarla para poder hacer previsiones. Este problema fue abordado por Brown,
que elabor la metodologa necesaria para aunar a la ponderacin exponencial la
estimacin de la tendencia. As, supongamos una tendencia lineal tipo
Y
t
= a + b t +
que puede interpretarse como un componente aleatorio () unido a un modelo o previsin
( Y
#
), es decir,
t
Y a b t = +
#
.
En el apartado 6.1. se ha expuesto que la serie suavizada exponencialmente puede
escribirse como
Los autores, 2001; Edicions UPC, 2001.
Otras tcnicas de previsin: ponderacin exponencial p73
t 1
i t
t t i 0
i 0
S = (1 ) Y (1 ) S

=
+


y sustituyendo en ella Y
t-i
por su expresin de tendencia, Y
t-i
= a + b (ti), se obtiene
[ ]
t 1
i t
t 0
i 0
t 1 t 1
i i t
0
i 0 i 0
S = (1 ) a b(t i) (1 ) S
(a bt) (1 ) b i (1 ) (1 ) S

=

= =
+ + =
= + +




Considerando que se dispone de suficiente informacin como para considerar que t es
grande, la convergencia de las series anteriores es tal que
t 1
i
i 0
1
(1 )

t 1
i
2
i 0
1
i (1 )

y 0 ) 1 (
t

En consecuencia,
t t
2
1 1
S (a bt) b Y b

= + =

%
Se observa que la serie ponderada de unos datos cronolgicos con tendencia lineal es una
recta paralela a los datos con un desplazamiento igual a
1-
b

.
Anlogamente, la serie resultante de volver a suavizar S
t
, ser
(2) (2)
t t t 1
S S (1 ) S

= +
que, por desarrollo anlogo con el del primer suavizado, se puede expresar como
(2)
t t t
1 1
S S b Y 2 b

= =
%


Restando las expresiones de
(2)
t t
S y S se obtiene la estimacin, asociada al instante t, de
la pendiente de la recta que ajusta la tendencia:
( )
(2)
t t t

b S S
1
=

Si se dispone del valor de la serie para el tiempo t, se puede calcular la pendiente estimada
en ese instante, es decir,
t

b , que representa el incremento del valor de la serie por unidad


de tiempo. En ese momento, la previsin para un valor del tiempo igual a t + T se puede
obtener como el valor previsto para el tiempo t, ms T veces
t

b , es decir,
t T t t

Y Y b T
+
= +
% %
.
En la ecuacin anterior
t
Y
%
hace las veces de ordenada cuando se toma como origen del
tiempo el valor t, es decir, equivale a
t
a .
Los autores, 2001; Edicions UPC, 2001.
p74 Series temporales
A partir de esta consideracin y de las expresiones del primer y segundo suavizado, se
puede escribir
(2)
t t t t t t
1 1
2S S 2 Y b Y 2 b Y a

= = =


# # #


Como consecuencia, a partir de los datos disponibles hasta un cierto instante se puede
predecir el inmediato siguiente. De esta manera la serie cronolgica formada por las
previsiones (estimaciones) de Y, segn el modelo lineal suavizado, estar constituida por los
valores
t t 1 t 1 t 1 t 1

Y b 1 b

= + = +
#
y los residuos, o errores de ponderacin, se podrn evaluar como
t t t
R Y Y =
#
Cuando la ltima informacin disponible es la del tiempo t, y se desea hacer la previsin
para T unidades de tiempo a partir de este instante, suponiendo que se mantenga el mismo
comportamiento de la serie, la previsin ser
t T t t

Y a b T
+
= +
#
Como ejemplo, se va a aplicar esta metodologa a los datos de la tabla 6.I. Para ello hay que
dar valores a y, para cada valor de t, calcular
(2)
t t t t t t

S , S , a , b , Y y R
#
. La evolucin
de los errores en funcin de se muestra en la figura 6.6.
MSE MAE
0,10 7,164 1,995
0,15 6,563 2,004
0,20 6,848 2,094
0,30 7,979 2,266
0,40 9,466 2,443
0,50 11,325 2,683
0,60 13,684 2,956
0,70 16,752 3,258
0,80 20,879 3,577
0,90 26,643 4,047
0
10
20
30
0 0,2 0,4 0,6 0,8 1
MSE

Fig. 6.6.- Seleccin de con tendencia lineal
El factor de ponderacin seleccionado es = 0,15; con l la aplicacin del mtodo de Brown
conduce a las ponderaciones que numricamente se detallan, para los ltimos datos en la
tabla 6.IV.
Los autores, 2001; Edicions UPC, 2001.
Otras tcnicas de previsin: ponderacin exponencial p75
Las previsiones desde t = 51 hasta t = 55, (T = 1,..., 4), que son las aceptables segn indic
el correlograma de la figura 6.2, se obtienen a partir de la expresin de las previsiones, es
decir,
t T t t

Y a b T
+
= +
#
= 35,794 + 0,549 T
La evolucin grfica de las series suavizada y prevista se muestran en la figura 6.7, donde
se observa una muy buena concordancia entre los datos reales y los suavizados, y se
aprecia que la previsin sigue la tendencia marcada por la serie cronolgica real.
t Y
t
S
t
(2)
t
S
t

b
t
Y
#
...
48
49
50
...
35,543
35,534
37,336
...
31,216
31,864
32,685
...
28,526
29,027
29,576
...
33,906
34,701
35,794
...
0,475
0,501
0,549
...
33,278
34,381
35,202
Tabla 6.IV.- Ponderaciones con =0,15 y tendencia lineal
0
10
20
30
40
0 20 40 60
t
Fig. 6.7.- Suavizado exponencial de Brown () y previsin (1), con = 0,15
La figura 6.8 contiene los residuos del modelo, o sea
t t t
R Y Y =
#
, y da idea de la
buena concordancia entre los datos reales y el modelo resultante del suavizado exponencial
de Brown. Este hecho avala la veracidad de las previsiones siempre y cuando no se
modifique el patrn de comportamiento que rega durante el perodo de recogida de datos.
Los autores, 2001; Edicions UPC, 2001.
p76 Series temporales
-4
-2
0
2
4
6
8
t
R
Fig. 6.8.- Residuos
En el prximo captulo se expondrn otros casos prcticos de anlisis de series temporales
para efectuar su modelizacin y realizar las previsiones oportunas.
Los autores, 2001; Edicions UPC, 2001.
Otros ejemplos p77
7 OTROS EJEMPLOS
En este captulo se van a desarrollar algunos casos prcticos de aplicacin de las tcnicas
propuestas anteriormente.
7.1 Ventas de papel
La tabla 7.I contiene las ventas mensuales de papel de impresin, en cientos de francos.
(Forecasting. Methods and Applications.; Makridakis, Wheelwright, McGee; pgina 433.)
En todos los ejemplos desarrollados hasta ahora, se dispona de unos datos, se proceda a
su modelizacin y a hacer previsiones, pero en ningn caso se han podido contrastar dichas
previsiones. De los 120 valores disponibles en el presente ejemplo se van a hacer dos
grupos, los 108 primeros, 9 aos, sern utilizados para modelizar la serie y hacer
previsiones y los ltimos 12 datos, un ao, se utilizarn para validar las previsiones
efectuadas
t Y t Y t Y t Y t Y
1 562,674 25 646,783 49 747,636 73 843,038 97 895,217
2 599,000 26 658,442 50 773,392 74 847,000 98 856,075
3 668,516 27 712,906 51 813,788 75 941,952 99 893,268
4 597,798 28 687,714 52 766,713 76 804,309 100 875,000
5 579,889 29 723,916 53 728,875 77 840,307 101 835,088
6 668,233 30 707,183 54 749,197 78 871,528 102 934,595
7 499,232 31 629,000 55 680,954 79 656,330 103 832,500
8 215,187 32 237,530 56 241,424 80 370,508 104 300,000
9 555,813 33 613,296 57 680,234 81 742,000 105 791,443
10 586,935 34 730,444 58 708,326 82 847,152 106 900,000
11 546,136 35 734,925 59 694,238 83 731,675 107 781,729
12 571,111 36 651,812 60 772,071 84 898,527 108 880,000
13 634,712 37 676,155 61 795,337 85 778,139 109 875,024
14 639,283 38 748,183 62 788,421 86 856,075 110 992,968
15 712,182 39 810,681 63 889,968 87 938,833 111 976,804
16 621,557 40 729,363 64 797,393 88 813,023 112 968,697
17 621,000 41 701,108 65 751,000 89 783,417 113 871,675
18 675,989 42 790,079 66 821,255 90 828,110 114 1006,852
19 501,322 43 594,621 67 691,605 91 657,311 115 832,037
20 220,286 44 230,716 68 290,655 92 310,032 116 345,587
21 560,727 45 617,189 69 727,147 93 780,000 117 849,528
22 602,530 46 691,389 70 868,355 94 860,000 118 913,871
23 626,379 47 701,067 71 812,390 95 780,000 119 868,746
24 605,508 48 705,777 72 799,556 96 807,993 120 993,733
Tabla 7.I.- Ventas mensuales de papel
Las figuras 7.1 y 7.2 muestran, respectivamente, la evolucin cronolgica de los datos y el
correlograma. De ellas se deduce la existencia de una estacionalidad de perodo 12,
naturalmente ligada a la evolucin mensual de los datos, y una tendencia creciente en los
primeros aos y ms estables en los ltimos; esto hace pensar en la posibilidad de un
Los autores, 2001; Edicions UPC, 2001.
p78 Series temporales
modelo parablico. Las previsiones, segn el correlograma, son aceptables a tres aos
vista.
0
200
400
600
800
1000
0 24 48 72 96 120 t
Y
Fig. 7.1.- Evolucin cronolgica de los datos de los primeros 9 aos

-1
-0,5
0
0,5
1
k
Fig. 7.2.- Correlograma
Dada la generalidad del mtodo, para tratar modelos aditivos, multiplicativos o mixtos, se
optar por la modelizacin con variables categricas.
Inicialmente se plantea el modelo que incluye el trmino lineal y el cuadrtico del tiempo, las
11 variables categricas y su conjuncin con el tiempo, es decir:
Y =
0
+
1
t +
2
t
2
+
2
Q
2
+
3
Q
3
+
4
Q
4
+
5
Q
5
+
6
Q
6
+
7
Q
7
+
8
Q
8
+
9
Q
9
+
10
Q
10
+
11
Q
11
+
12
Q
12
+
2
Q
2
t +
3
Q
3
t +
4
Q
4
t +
5
Q
5
t
+
6
Q
6
t +
7
Q
7
t +
8
Q
8
t +
9
Q
9
t +
10
Q
10
t +
11
Q
11
t +
12
Q
12
t +
Los autores, 2001; Edicions UPC, 2001.
Otros ejemplos p79
Despus de eliminar todos los trminos no significativos, el modelo definitivamente ajustado
se presenta en la tabla 7.II donde es destacable el buen ajuste (R
2
= 95,59%) obtenido.
El modelo definitivo es

Y= 579,34 + 4,12 t 0,011 t


2
+80,1576 Q
3
113,66 Q
7
399,06 Q
8
83,26 Q
9
1,55 t Q
8
0,83 t Q
11
es decir, se trata de un modelo mixto, en donde la ecuacin de la tendencia es distinta para
algunos meses. As los meses de enero (Q
1
), febrero (Q
2
), abril (Q
4
), mayo (Q
5
), junio (Q
6
),
octubre (Q
10
) y diciembre (Q
12
) tienen el mismo comportamiento puesto que sus variables
categricas no aparecen en el modelo, hecho que los hara distinguibles entre s. Los meses
de marzo (Q
3
), julio (Q
7
), agosto (Q
8
) y septiembre (Q
9
) tienen distinta ordenada en el origen,
es decir, su volumen de ventas tiene la misma evolucin parablica con el tiempo pero con
distinto valor inicial de salida. Adems agosto (Q
8
) y noviembre (Q
11
) tienen distinta
pendiente que los dems; al ser su coeficiente negativo, indica que su velocidad de
crecimiento es sistemticamente inferior a la del resto de meses del ao.
nu S.C. C.M. F p-val
Regresin 8 2782737,3 347842,16 268,54 1,5011E-63
Residuos 99 128237,3 1295,33
Total 107 2910974,6
Coeficientes Error tpico t p-val
Ord. Origen 570,3432 10,9786 51,9503 0,0000
t 4,1152 0,4487 9,1704 0,0000
t^2 -0,0113 0,0040 -2,8242 0,0057
Q3 80,1576 12,8019 6,2614 0,0000
Q7 -113,6589 12,8057 -8,8756 0,0000
Q8 -399,0648 25,9335 -15,3880 0,0000
Q9 -83,2560 12,8143 -6,4971 0,0000
tQ8 -1,5549 0,4051 -3,8384 0,0002
tQ11 -0,8270 0,1932 -4,2797 0,0000
R^2 = 0,9559
Tabla 7.II.- Modelo resultante
La figura 7.3. muestra el ajuste del modelo obtenido sobre los datos reales de los nueve
aos estudiados, y la 7.4 los residuos, diferencia entre el valor real y el modelizado,
observndose un buen ajuste general a todos los puntos. En la figura 7.3, a travs de los
tringulos de los valores modelizados, se ve claramente la homogeneidad de
comportamiento de un conjunto de meses, frente a la disparidad de los otros
Los autores, 2001; Edicions UPC, 2001.
p80 Series temporales
0
100
200
300
400
500
600
700
800
900
1000
0 20 40 60 80 100 120 t
Fig. 7.3.- Datos reales ( ) y modelizados ( u )
-100
-75
-50
-25
0
25
50
75
100
0 20 40 60 80 100 120
t
R
Fig. 7.4.- Residuos
Con el modelo disponible se puede proceder a hacer previsiones, por ejemplo para los
prximos doce meses. En la tabla 7.III se presentan los valores previstos junto a los que
realmente se obtuvieron en estos meses y que han sido separados y guardados a la hora de
hacer la modelizacin anterior; tambin se han calculado las diferencias entre ellas y el
porcentaje de error de previsin sobre el valor real. Hay que resaltar que las pequeas
discrepancias entre la previsin y el valor real, en parte, deben ser atribuidas al componente
aleatorio, cuya presencia en cada momento no hay que olvidar. La figura 7.5 muestra ambos
conjuntos de datos, de los que slo hay que comentar la gran concordancia entre la
previsin y la realidad, lo cual valida lo precedente de la aplicacin de la metodologa del
anlisis mediante variables categricas.
Los autores, 2001; Edicions UPC, 2001.
Otros ejemplos p81
t Y Previsin Diferencia %
109 875,024 884,998 -9,974 -1,14
110 992,968 886,645 106,323 10,71
111 976,804 968,430 8,374 0,86
112 968,697 889,872 78,825 8,14
113 871,675 891,451 -19,776 -2,27
114 1006,852 893,008 113,844 11,31
115 832,037 780,882 51,155 6,15
116 345,587 316,626 28,961 8,38
117 849,528 814,283 35,245 4,15
118 913,871 899,010 14,861 1,63
119 868,746 802,041 66,705 7,68
120 993,733 901,876 91,857 9,24
Tabla 7.III. - Previsiones y valores reales obtenidos en el mismo perodo
200
400
600
800
1000
1200
108 110 112 114 116 118 120 122
t
Fig. 7.5.- Previsiones ( u ) y valores reales ( ) del ao siguiente
7.2 Generacion de electricidad
En la tabla 7.IV se presenta la generacin mensual de electricidad, por la industria elctrica
de Estados Unidos, durante 8 aos, (Forecasting. Methods and Applications.; Makridakis,
Wheelwright, McGee; pgina 469).
Como en el caso anterior, de los 96 valores disponibles en el presente ejemplo se van a
hacer dos grupos, los 84 primeros, 7 aos, sern utilizados para modelizar la serie y hacer
previsiones y los ltimos 12 datos, resaltados en cursiva en la tabla y que corresponden al
ltimo ao, se utilizarn para validar las previsiones efectuadas
Los autores, 2001; Edicions UPC, 2001.
p82 Series temporales
t Y t Y t Y t Y
1 144,58 25 164,33 49 196,37 73 209,69
2 137,3 26 147,08 50 162,73 74 186,35
3 140,06 27 155,48 51 169,16 75 182,85
4 132,14 28 146,22 52 156,85 76 169,96
5 137,75 29 153,23 53 169,33 77 178,07
6 145,52 30 162,44 54 180,79 78 186,68
7 147,85 31 176,82 55 198,92 79 202,25
8 162,82 32 179,72 56 196,09 80 204,85
9 147,36 33 155,22 57 176,26 81 180,75
10 143,74 34 154,94 58 166,39 82 179,71
11 143,87 35 152,79 59 167,07 83 177,5
12 154,35 36 169,35 60 184,21 84 188,71
13 157,24 37 178,31 61 197,83 85 200
14 142,46 38 156,67 62 173,5 86 188,72
15 150,02 39 164,16 63 173,19 87 187,47
16 142,02 40 153,15 64 159,74 88 168,72
17 153,49 41 157,35 65 175,24 89 175,73
18 156,13 42 173,36 66 188,31 90 189,43
19 177,91 43 186,41 67 202,68 91 216,78
20 173,81 44 186,38 68 206,41 92 215,39
21 152,16 45 164,97 69 185,57 93 191,48
22 151,87 46 163,63 70 175,8 94 178,56
23 149,73 47 168,99 71 176,17 95 178,55
24 159,6 48 183,09 72 191,87 96 195,59
Tabla 7.IV.- Generacin mensual de electricidad
Las figuras 7.6 y 7.7 corresponden, respectivamente, a la evolucin cronolgica de los datos
de los siete aos utilizados en la modelizacin, y su correlograma. Al ser los datos
mensuales, parece que de haber alguna estacionalidad, sta debera ser de perodo 12, es
decir anual, sin embargo no es esta la situacin del caso estudiado. El correlograma
muestra de forma inequvoca que existe una estacionalidad de perodo 6, la cual, aunque
menos evidente, tambin se detecta en la evolucin cronolgica. Intentando buscar una
explicacin a dicha periodicidad, quizs sera posible pensar que el consumo elctrico, y por
tanto la electricidad generada por las centrales, tiene similar comportamiento en los meses
clidos que en los fros como consecuencia del consumo por los aires acondicionados,
mientras que la parte del consumo atribuible a la industria en general, no tiene porque
presentar distinto comportamiento de un mes a otro. En cuanto a la tendencia, es posible
que sea cuadrtica, tal como se detecta en la evolucin cronolgica de los datos.
Los autores, 2001; Edicions UPC, 2001.
Otros ejemplos p83
100
120
140
160
180
200
220
0 12 24 36 48 60 72 84
t
Y
Fig.7.6.- Evolucin cronolgica de la electricidad generada en siete aos
-1
-0,5
0
0,5
1
k
r
k
Fig.7.7.- Correlograma
El modelo inicial por variables categricas debe incluir la tendencia, la estacionalidad,
reflejada en las variables Q, y sus posibles cambios en el tiempo, trminos Q
j
t, es decir:
Y =
0
+
1
t +
2
t
2
+
2
Q
2
+
3
Q
3
+
4
Q
4
+
5
Q
5
+
6
Q
6
+
2
Q
2
t +
3
Q
3
t +
4
Q
4
t +
5
Q
5
t +
6
Q
6
t +
Despus de eliminar los trminos no significativos, regresin paso a paso, el modelo
resultante se presenta en la tabla 7.V. Hay que destacar especialmente el buen ajuste,
reflejado en un coeficiente de determinacin, R
2
, del 86,64 %.
Los autores, 2001; Edicions UPC, 2001.
p84 Series temporales
nu S.C. C.M. F p-val
Regresin 7 24674,8398 3524,9771 70,4316 1,2626E-30
Residuos 76 3803,6637 50,0482
Total 83 28478,5035
Coeficientes Error tpico t p - val
Ord. Origen 143,8383 1,7040 84,4105 0,0000
t 0,9072 0,0511 17,7608 0,0000
Q4 -8,7533 4,2164 -2,0760 0,0413
tQ2 -0,2042 0,0567 -3,6025 0,0006
tQ3 -0,4053 0,0562 -7,2125 0,0000
tQ4 -0,4006 0,0934 -4,2904 0,0001
tQ5 -0,4800 0,0553 -8,6822 0,0000
tQ6 -0,2707 0,0549 -4,9352 0,0000
R^2 = 0,8664
Tabla 7.V.- Modelo resultante
En consecuencia, el modelo es

Y= 143,838 + 0,907 t 8,753 Q


4
0,204 Q
2
t 0,405 Q
3
t
0,401 Q
4
t 0,480 Q
5
t 0,271 Q
6
t
y de l se deduce que el trmino cuadrtico del tiempo no ha resultado significativo, pero la
serie presente una tendencia lineal y creciente, pendiente igual a 0,907. La figura 7.8
muestra la modelizacin de la energa elctrica producida para cada uno de los 6 meses que
componen un perodo. El comportamiento estacional no es fcil de interpretar; el cuarto mes
de cada perodo pierde 8,753 unidades (coeficiente de Q
4
) respecto a todos los dems, que
tienen una ordenada en el origen comn. En cada mes la evolucin con el tiempo es distinta,
pero frente al primer mes al que correspondera un crecimiento asociado a una pendiente
de 0,907, se podran hacer dos agrupaciones, los meses 2 y 6, con una prdida de
pendiente del orden de 0,20,3, (rectas casi coincidentes en la figura 7.8) y los 3, 4 y 5 con
una prdida, respecto al primero, de 0,40,5 unidades en la pendiente, que dan lugar a una
evolucin similar, tal como se observa en el grfico.
120
140
160
180
200
220
240
0 12 24 36 48 60 72 84 t
Y
Fig. 7.8.- Modelo para cada componente del perodo estacional
Los autores, 2001; Edicions UPC, 2001.
Otros ejemplos p85
La figura 7.9 contiene el grfico del modelo ajustado sobre los datos iniciales, y la 7.10 los
residuos. En ambas se puede apreciar la buena adecuacin del modelo a los datos. Quizs
se podra destacar que en el inicio de los datos (figura 7.9), hay algunos valores reales de
produccin de energa elctrica claramente distintos, en cuanto a su comportamiento del
resto. Esto incide en un mayor valor del residuo, y si no es posible conocer las causas de
estas producciones ms altas que lo previsto deberan atribuirse al azar.
100
120
140
160
180
200
220
240
0 12 24 36 48 60 72 84
t
Y
Fig. 7.8.- Datos reales y modelizados >

-20
-15
-10
-5
0
5
10
15
20
0 12 24 36 48 60 72 84
t
R
Fig. 7.9.- Residuos
Con el modelo resultante, se pueden hacer previsiones para un perodo no superior al ao,
segn evidencia el correlograma. Esto es suficiente para comprobar la adecuacin de la
previsin, segn el modelo obtenido, con los 12 datos reales de los que se dispone y que
han sido reservados en la modelizacin para comprobar la fiabilidad de las predicciones. La
tabla 7.VI contiene los valores reales las previsiones segn el modelo obtenido y el error
respecto al valor medido, salvo el primero, los dems presentan una buena aproximacin
Los autores, 2001; Edicions UPC, 2001.
p86 Series temporales
t Y Previsin Diferencia %
85 200 220,95 -20,95 -10,48
86 188,72 204,30 -15,58 -8,25
87 187,47 187,50 -0,03 -0,02
88 168,72 179,67 -10,95 -6,49
89 175,73 181,86 -6,13 -3,49
90 189,43 201,12 -11,69 -6,17
91 216,78 226,40 -9,62 -4,44
92 215,39 208,52 6,87 3,19
93 191,48 190,51 0,97 0,50
94 178,56 182,70 -4,14 -2,32
95 178,55 184,00 -5,45 -3,05
96 195,59 204,31 -8,72 -4,46
Tabla 7.VI.- Previsiones y valores reales obtenidos en el mismo perodo
La figura 7.10 muestra ambos conjuntos de valores, en donde a pesar de la buena
aproximacin, es destacable que los valores reales, casi siempre son inferiores a los
previstos.
En esta situacin cabra la posibilidad de pensar en un posible cambio en el comportamiento
del modelo, es decir, quizs la tendencia al crecimiento ha sufrido un frenazo en el ltimo
ao; esto se confirmara con la evolucin futura, sin embargo si se examina la historia, se
puede detectar que en los ltimos 12 meses incluidos en la modelizacin, los residuos
negativos predominan sobre los positivos, figura 7.9, o sea que, en muchos casos, los
valores del modelo superan a los valores reales. La figura 7.11, une a los datos reales y las
previsiones, las lneas de evolucin del modelo en cada componente del perodo, mostrando
el mismo hecho de una situacin de los valores reales por debajo de la previsin.
160
170
180
190
200
210
220
230
84 86 88 90 92 94 96
t
Y
Fig. 7.10.- Previsiones > y valores reales del ao siguiente
Los autores, 2001; Edicions UPC, 2001.
Otros ejemplos p87

160
180
200
220
240
84 86 88 90 92 94 96
t
Y
Fig. 7.11.- Previsiones y valores reales junto al modelo
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p89
PRCTICAS DE SERIES TEMPORALES CON EXCEL
En este texto se presentan un conjunto de cuatro prcticas realizadas sobre unos archivos
de datos disponibles en formato Excel.
El objetivo de estas prcticas es mostrar, en cada caso, la sistemtica de anlisis de los
datos utilizando la hoja de clculo. No pretenden ser un manual de Excel, pero s dar una
informacin detallada de cmo se puede llevar a cabo el estudio en cuestin, a dems de
servir de gua para la realizacin de la prctica que cada alumno tiene encomendada.
PRCTICA 1. DESCOMPOSICIN CLSICA DE UNA SERIE ADITIVA
OBJETIVO: Se dispone del valor diario de la caja resultante de las ventas de un
supermercado a lo largo de 12 semanas. Es necesario analizar los datos de esta serie
cronolgica, estimar el modelo de comportamiento, estudiar su ajuste y hacer las
previsiones necesarias. Todo ello se realizar mediante la hoja de clculo Excel 97 de
Microsoft.
1.1 Recuperacion de los datos
Desde Excel se debe recuperar el archivo que contiene los datos objeto de la prctica, y que
se encuentran en el directorio habitual de la red. Para ello, se debe seguir la secuencia
(figura 1.1):
Archivo 6 66 6 Abrir
y, ahora, ir al directorio donde se encuentra el archivo Prctica 1.xls, seleccionarlo y
presionar Abrir.
Fig. 1.1
Una vez tenemos el archivo abierto, observamos que consta de una hoja llamada Datos
donde figuran 3 columnas de 72 valores cada una, con la estructura mostrada parcialmente
en la figura 1.2. En cada columna hay 72 valores, es decir, cada columna comienza en la fila
1 (con el ttulo) y acaba en la 73.
La columna A, llamada Semana contiene valores de 1 a 12 correspondientes a las 12
semanas en que se ha recogido la informacin; la B, Da, indica el da de la semana; y la C
contiene los valores de las ventas diarias, que se llaman Y.
Los autores, 2001; Edicions UPC, 2001.
p90 Series temporales
Fig. 1.2
En primer lugar, se debe preparar una nueva hoja donde es situarn los sucesivos grficos,
y que se denominar Grficos. Para ello, al hacer doble clic en la pestaa Hoja2 (figura
1.3), esta palabra quedar en vdeo inverso y permitir escribir Grficos.
Fig. 1.3
De forma similar, a la Hoja3 la denominaremos Tendencia-Modelo.
1.2 Anlisis de la evolucin de la serie cronolgica
Situados en la hoja Datos, es necesario crear una columna con los valores consecutivos del
tiempo y, para mayor facilidad al hacer los grficos, es bueno que esta columna preceda a la
de los valores de las ventas (Y). Hacer clic sobre la letra C del encabezado de la columna
que quedar toda negra; pulsando el botn derecho, seleccionar Insertar (figura 1.4). En
este momento la columna de los datos se habr desplazado a la D y habr dejado la C
vaca; aqu es donde se introducirn los valores correlativos del tiempo. En C1 escribir
tiempo, hacer C2 = 1 y arrastrar (tecleando tambin Ctrl) desde C2
+
hasta C73; aqu
aparecer el valor 72 (pgina 108 de esta prctica).
Para obtener el grfico de la evolucin de las ventas frente al tiempo, se selecciona desde
C1 hasta C73 (tiempo), y desde D1 hasta D73 (ventas =Y) y se pincha el icono de grficos
o tambin, en la barra de herramientas, Insertar y despus Grfico.
Entonces surge el Asistente para Grficos (figura 1.5), donde se debe seleccionar
XY (Dispersin)
y, entonces la opcin (3; 1), es decir, Dispersin con puntos conectados por lneas y
Siguiente.
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p91
Fig. 1.4
Fig. 1.5
Los autores, 2001; Edicions UPC, 2001.
p92 Series temporales
En el paso 2 del asistente de grficos se hace directamente Siguiente y en el paso 3 (figura
1.6), se pueden editar los ttulos a voluntad.
Fig. 1.6
Por ejemplo, en la pestaa Ttulos
Ttulo del grfico: Evolucin cronolgica
Eje de categoras (X): tiempo
Eje de valores (Y): ventas
En la pestaa Leyenda
eliminar la marca Z de Mostrar leyenda, pinchando sobre la misma, para dejar slo .
Siguiente
El paso 4 (figura 1.7), permite situar el grfico donde se desee, para ello se marca
Como objeto en
y pinchando la marca v aparece el conjunto de hojas disponibles; all se selecciona
Grficos.
Finalmente
Terminar
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p93
Fig. 1.7
Con el grfico seleccionado (de forma que se muestre recuadrado externamente con las
marcas en el entorno), se puede situar en el lugar adecuado y darle el tamao que sea
necesario.
Si se quiere editar el grfico y, por ejemplo, eliminar el fondo gris del mismo:
Pinchar sobre este fondo, rea de trazado
Presionar el botn derecho
Formato del rea de trazado
rea
Ninguna Aceptar
Para cambiar la escala del eje vertical y aprovechar toda la superficie de la figura:
Situar el cursor sobre el eje de ordenadas, Eje de valores
Hacer doble clic o bien presionar el botn derecho
Formato de ejes (figura 1.8)
Pestaa Escala: Poner el mnimo a 0, el mximo a 12000, la unidad mayor
a 4000 y la menor a 1000 Aceptar
Los autores, 2001; Edicions UPC, 2001.
p94 Series temporales
Fig. 1.8
Si se quiere cambiar la escala del tiempo, por ejemplo para que vaya de 6 en 6 unidades,
que son los valores que forman una semana, hay que situar el cursor sobre el eje de
abscisas (Eje de valores (X)) y con el botn derecho seguir los mismos pasos que antes,
para dejar un mnimo de 1, un mximo de 78, la unidad mayor a 6 y la menor a 1.
El resultado es el grfico de la pgina 111 de esta prctica.
Conclusiones: Se detecta una clara estacionalidad, de perodo p=6, y posiblemente una
tendencia decreciente.
1.3 Estabilizacin de la serie
Para poder modelizar la serie, en primer lugar se debe estabilizar calculando las medias
mviles de perodo p; en el caso del ejemplo p=6.
Clculo de las medias mviles
Situados en la casilla E1 escribir como ttulo de la columna Y(p=6). Al ser de perodo 6, la
media de los 6 primeros valores se debe situar entre el tercer y el cuarto lugar, filas 4 y 5;
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p95
como eso no lo podemos hacer en la hoja de clculo optamos por empezar en la casilla 5.
Situados entonces en E5, hacemos
= Promedio (D2:D7) (aparece como resultado 6135)
Arrastramos hasta E71, que contendr la media de los 6 ltimos valores de la serie
(Promedio(D68:D73)), en este caso 5256,33.
Al ser de perodo par debemos volver a la media de 2 en 2: la primera media mvil ocupar
el cuarto valor (5 fila), y la ltima el 69

(70

fila), ya que en total se pierden 3 valores al inicio


y 3 al final. Situados en F5 escribiremos
= Promedio (E5:E6) (aparece como resultado 6103,75)
Arrastramos hasta F70, que contendr la media de los 2 ltimos valores de la columna
anterior (Promedio(E70:E71)), en este caso 5262,33.
Titularemos la columna F, Y mvil, y lo escribiremos en F1. En las pginas 107 y 108 se
puede ver el conjunto de valores que resultan.
Grfico de medias mviles
Seleccionar, manteniendo presionada la tecla Control, desde C2 hasta C73, (tiempo), desde
D2 hasta D73, (Y) y desde F2 hasta F73, (Y mvil).
Con el icono de grficos
Paso 1: Asistente para Grficos (figura 1.5),
XY (Dispersin)
(3; 1), Dispersin con puntos conectados por lneas
Siguiente
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo medias mviles (p=6), sacar la leyenda y
Siguiente
Paso 4: Situar el grfico como Objeto en la hoja grficos. Terminar
Es aconsejable editar el grfico, tal como se ha hecho con el anterior, para que la escala de
ordenadas vaya de cero a doce mil; tambin se puede cambiar la escala de tiempo como
antes. El resultado es el grfico de la pgina 111.
Conclusiones: Se detecta una tendencia decreciente, casi seguramente lineal, pero podra
ser cuadrtica? Se deber estudiar en el momento oportuno.
Los autores, 2001; Edicions UPC, 2001.
p96 Series temporales
1.4 Estacionalidad
El estudio de la estacionalidad incluye el clculo de los ndices estacionales, en modelo
aditivo que es el caso del ejemplo, y su representacin grfica.
Clculo de los ndices estacionales
Este clculo es muy cmodo hacerlo con una tabla dinmica. En primer lugar se deben
obtener los valores de W, que son las diferencias entre los valores de la serie (Y, columna
C) y las medias mviles (Y mvil, columna E). Estos valores se situarn en la columna G.
En la casilla G1 escribir W. Situados en G5, hacer
= D5 F5 (Y Y mvil)
y arrastrar hasta G70.
En la barra de herramientas
Datos 6 66 6 Asistente para tablas dinmicas
Paso 1: Dnde estn los datos?
Lista o base de datos de Microsoft Excel
Siguiente
Paso 2: Dnde estn los datos que desea usar?
Rango: $AEL:$G$73 (es la opcin por defecto,
que incluye todos los datos)
Siguiente
Paso 3: arrastrar W a DATOS y Da a FILA (figura 1.9)
Doble clic sobre Contar de W
Promedio
Aceptar (ahora el cuadro es Promedio de W )
Siguiente
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p97
Fig. 1.9
Paso 4: Dnde desea situar la tabla dinmica? (figura 1.10)
Hoja de clculo existente
B80 Indicar una casilla tal que ella y las
contiguas estn libres para situar la tabla
Fig. 1.10
Los autores, 2001; Edicions UPC, 2001.
p98 Series temporales
El resultado es la siguiente tabla, copiada de la pgina 108.
A B C D
80 Promedio de W
81 da Total
82 lunes -2331,37
83 martes -939,924
84 mircoles -1963,33
85 jueves 304,7803
86 viernes 3098,348
87 sbado 1898,394
88 Total general 11,14899
Los valores de las casillas C82 C87 son, respectivamente, E*
1
, E*
2
, , E*
6
; la casilla C88
(llamada Total general en B88) es la media de las anteriores, o sea, E* .
Para calcular los ndices estacionales, en la casilla E81 se escribe Ind. Est. como ttulo, y se
define E82 con la expresin
= C82 - $C$88 (anclar la casilla C88 de la media para que no cambie
al arrastrar la frmula)
Arrastrar hasta E87
Los resultados obtenidos se pueden observar en las pginas 107 y 108.
Repetir los valores de la estacionalidad por los 72 valores de la serie. Situados en la
columna H, en H1 escribir Ind. Est.
Seleccionar las casillas E82 E87
Edicin 6 66 6 Copiar
Situarse en H2
Edicin 6 66 6 Pegado especial 6 66 6 Valores Aceptar
Llenar toda la columna (72 valores) cortando de H2 a H7 y pegando sucesivamente desde
H8 hasta H73; tambin se puede hacer marcando como bloque H2 H7 y, presionando la
tecla de Ctrl, arrastrarlo desde el extremo inferior derecho del cuadro (+) hasta H73.
Grfico de la estacionalidad
Seleccionar los valores de los ndices estacionales, casillas E82 hasta E87 (o tambin desde
H2 hasta H7).
Con el icono de grficos
Paso 1: Lneas6 66 6 Lnea con marcadores (2, 1) de la figura 1.11 Siguiente
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p99
Fig. 1.11
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo ndices estacionales, quitar la leyenda y
Siguiente
Paso 4: Situar el grfico como Objeto en la hoja Grficos. Terminar
Situar el grfico en la posicin y con tamao deseado.
Si se quiere que los valores del eje de abscisas queden fuera del grfico, situar el cursor
sobre el eje de ordenadas (Eje de valores), y haciendo doble clic sale la pantalla Formato
de ejes (figura 1.12). En la pestaa Escala se debe entrar al Eje de categoras (X) cruza
en:
y cambiar el 0 por 3000
Fig. 1.12
El resultado es el grfico de la pgina 113.
Conclusiones: Analizar qu se puede decir de cada da de la semana referente a la
estacionalidad. Cul es el da con ms ventas?, y el de menor nmero? En cunto difieren
de la media semanal cada uno de estos das?
Los autores, 2001; Edicions UPC, 2001.
p100 Series temporales
1.5 Estimacin de la tendencia
Observando el grfico de las medias mviles, superpuesto a la evolucin de los datos
cronolgicos de la pgina 111, no se ve nada claro si la tendencia es de tipo lineal o
cuadrtico; eso, en parte puede ser atribuido al hecho de que la escala vertical del citado
grfico no es adecuada para estudiar las medias mviles. De modo que, lo primero que se
debe hacer es un nuevo grfico con una escala lo ms amplia posible.
Seleccionar, manteniendo presionada la tecla Ctrl, desde C2 hasta C73 (Tiempo), y desde
F2 hasta F73 (Y mvil) de la hoja Datos.
Con el icono de grficos
Asistente para Grficos (figura 1.5)
XY (Dispersin)
(3; 1), Dispersin con puntos conectados por lneas
Siguiente
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo Media mvil (tendencia), sacar la leyenda y
Siguiente
Paso 4: Situar el grfico como Objeto en la hoja grficos. Terminar
Es necesario editar el grfico, tal como se ha hecho con el anterior, para que la escala de
ordenadas vaya desde cinco mil hasta siete mil. El resultado es el grfico de la pgina 112.
Con la nueva escala parece bastante claro que puede haber una tendencia cuadrtica, por
eso, se ha de proceder a ajustar un modelo parablico con el bien entendido de que si el
trmino cuadrtico no fuese significativo ya se detectara en el anlisis de los resultados, y
se procedera en consecuencia; es decir, se debera ajustar un nuevo modelo sin el trmino
que ha resultado no significativo.
Para aligerar la presentacin de la hoja de clculo, realizaremos el estudio de la tendencia,
de los residuos y de las previsiones en una nueva hoja, que ya tenemos preparada desde el
inicio con el nombre Tendencia-Modelo.
En primer lugar copiaremos todo lo que nos haga falta de la hoja Datos. Situados aqu:
Seleccionar las columnas Tiempo, Y, Y mvil y Ind. Est., es decir, C1 C73, D1 D73, (y
manteniendo presionada la tecla Ctrl) F1 F73 y H1 H73
Edicin 6 66 6 Copiar
Acceder a la hoja de Tendencia-Modelo, haciendo clic sobre la pestaa con su nombre.
Situados en la casilla A1
Edicin 6 66 6 Pegar
En este momento estn ocupadas las columnas A, B, C y D. Para poder hacer el ajuste
mnimo cuadrtico para la tendencia, mediante un modelo parablico, se debe disponer de
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p101
una columna con los valores del tiempo al cuadrado, que necesariamente ha de estar
situada al lado de la columna del tiempo; por eso tendremos que insertarla entre las
columnas A y B.
Hacer clic sobre la letra B del encabezado de la columna, que quedar toda negra;
presionar el botn derecho para seleccionar Insertar (figura 1.4). La columna de los datos
se ha desplazado a la C y ha dejado la B vaca; aqu se introducirn los valores del tiempo
al cuadrado.
En B1 escribir Tiempo^2
Situados en B2 escribir la expresin =A2*A2
Arrastrar hasta B73; aqu habr el valor 5184, que es el cuadrado de 72. En las pginas 109
y 110, se puede ver la disposicin de los valores.
Abrir Herramientas 6 66 6 Anlisis de datos 6 66 6 Regresin
Llenar los campos segn se presenta en la figura 1.13, es decir:
Rango Y de entrada D5:D70 (medias mviles)
Rango X de entrada A5:B70 (tiempo y tiempo^2)
Opciones de salida:
Rango de salida: A93 (casilla vaca, a partir de donde se presentarn los
resultados de la regresin)
Fig. 1.13
Los autores, 2001; Edicions UPC, 2001.
p102 Series temporales
Los resultados obtenidos se muestran en la figura 1.14, extrada de la pgina 110.
Conclusiones: El nivel de significacin (valor p) de los coeficientes asociados al tiempo y al
tiempo^2 es inferior a 0,05. Por lo tanto, con un riesgo de la primera especie del 5%, se
debe aceptar el modelo cuadrtico, que en este caso es:
2

T 6311,51 27,30 t 0,18 t = +


con un R
2
del 85,6 %.
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
A B C D E F G
Resumen
stad st cos
R 0,92513
R^2 0,85587
R^2 ajust 0,85130
Error tpico 114,20021
n 66
ANOVA
u S de C C a o p
Regresin 2 4879153,47 2439576,7 187,059889 3,1646E-27
Residuos 63 821626,351 13041,688
Total 65 5700779,82
Coefs o t p co t Va o p
Ord. Origen 6311,5139 51,8296 121,7743 1,7087E-76
Tiempo -27,3032 3,2473 -8,4079 6,9185E-12
Tiempo^2 0,1832 0,0433 4,2298 7,7177E-05
Fig. 1.14
Una vez obtenida la ecuacin de la tendencia, podemos calcular su valor para los diferentes
tiempos de los que se dispone de informacin. Para ello crearemos una nueva columna.
Situados en F1 escribir Tendencia, que ser el ttulo de la columna
En F2 escribir la expresin que acabamos de obtener,
= 6311,51 27,3*A2 + 0,18*B2
y arrastrarla hasta F73
Para ver la bondad del ajuste, se puede hacer un grfico que compare los valores de las
medias mviles y los de la tendencia ajustada. Por eso seleccionar, presionando la tecla
Ctrl, desde A1 hasta A73, desde D1 hasta D73 y desde F1 hasta F73
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p103
Con el icono de grficos
Asistente para Grficos (figura 1.5)
XY (Dispersin)
(3; 1) Dispersin con puntos conectados por lneas
Siguiente
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo Tendencia, sacar la leyenda y Siguiente
Paso 4: Situar el grfico como Objeto en la hoja Grficos. Terminar
Es necesario editar el grfico, tal como se ha hecho con el anterior, para que la escala de
ordenadas vaya desde cinco mil hasta a siete mil.
Si se quiere, situados sobre uno de los puntos de la Serie tendencia, con el botn
derecho seleccionar
Formato de punto de datos
Marcador Ninguno
El resultado es el grfico de la pgina 112, donde se puede valorar el ajuste.
1.6 Modelo y residuos
En una serie aditiva, el modelo se obtiene como resultado de sumar la tendencia y la
estacionalidad de cada punto.
Situados en G1 escribir, como ttulo, Y mod.
En G2 la expresin = F2 + E2 (tendencia + estacionalidad)
Arrastrar hasta G73, que evidentemente contendr la expresin F73+E73
Los residuos son la diferencia entre los valores originales, Y, y el modelo, Y mod.
Situados en H1 escribir, como ttulo, Residuos
En H2 la expresin = C2 G2 (Y Y mod)
Arrastrar hasta H73
Para hacer la representacin grfica del modelo ajustado en comparacin con los valores
originales, se debe seleccionar, de la hoja Tendencia Modelo, los valores del tiempo, de la
Y y de la Y modelizada, o sea, A1 A73, C1 C73 y G1 G73.
Los autores, 2001; Edicions UPC, 2001.
p104 Series temporales
Con el icono de grficos
Asistente para Grficos (figura 1.5)
XY (Dispersin)
(3; 1), Dispersin con puntos conectados por lneas
Siguiente
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo Modelo ajustado, sacar la leyenda y
Siguiente
Paso 4: Situar el grfico como Objeto en la hoja Grficos. Terminar
Si se desea dejar con puntos la serie original y con lnea la del modelo ajustado, hay que
situarse sobre uno de los puntos de la Serie Y, y con el botn derecho del ratn
seleccionar:
Formato de punto de datos
Lnea Ninguna
Situarse, luego, sobre un punto de la Serie Y mod, y con el botn derecho seleccionar
Formato de punto de datos
Marcador Ninguno
El resultado es el grfico de la pgina 113, donde se puede valorar el modelo.
Para hacer la representacin grfica de los residuos en funcin del tiempo, seleccionar, de
la hoja Tendencia Modelo, los valores del tiempo y de los residuos, o sea, A1 A73 y
H1 H73.
Con el icono de grficos
Asistente para Grficos (figura 1.5)
XY (Dispersin)
(3; 1), Dispersin con puntos conectados por lneas
Siguiente
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo Residuos, sacar la leyenda y Siguiente
Paso 4: Situar el grfico como Objeto en la hoja Grficos. Terminar
Editar el grfico para, entre otras cosas, sacar los valores del eje de abscisas fuera del
mismo, para ello se sita el cursor sobre el eje de ordenadas, Eje de valores (Y), y
haciendo doble clic sale la pantalla Formato de ejes.
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p105
En la pestaa Escala, modificar
Mnimo: 800
Eje de Valores (X) cruza en: 800
En la pestaa Nmero, en Posiciones decimales poner un cero.
El resultado es el grfico de la pgina 114.
Conclusiones: La correspondencia entre los datos y el modelo es lo suficientemente buena.
No se detecta ningn punto especialmente alejado del comportamiento modelizado por el
conjunto. La mayora de los residuos se mueven en el intervalo de 400 a 400, el ms
alejado de cero correspondiendo a los valores del tiempo 2, 27 y 33, que no parecen
especialmente anmalos en el grfico del modelo ajustado.
1.7 Previsiones
Si se quieren conocer las previsiones de las ventas del supermercado que estamos
estudiando, a lo largo de las tres prximas semanas (18 das) en la hoja
Tendencia Modelo prolongar las columnas del tiempo, la tendencia, la estacionalidad y
crear una nueva columna para las previsiones.
Para la columna A, Tiempo, arrastrar presionando la tecla Ctrl desde la casilla A73 hasta la
A91, donde ha de aparecer el valor 90.
En la E74, Estacionalidad, el primer valor que se debe aadir es el que corresponde al
tiempo 73, es decir mltiple de 6 ms 1; por tanto, hay que copiar desde el primer valor del
ndice hasta el 18. Marcar como bloque las casillas E2E19 y hacer Edicin 6 66 6 Copiar.
Situados en E74, Edicin 6 66 6 Pegar.
En la F, Tendencia, arrastrar la expresin desde el ltimo valor disponible, el 73, hasta el
deseado, el 91.
Situados en I1, poner como ttulo Previsiones.
En I74 escribir la expresin = E74 + F74 y arrastrarla hasta E91.
Haciendo eso, obtenemos los resultados que se muestran en la pgina 110.
El grfico de las previsiones, junto con la serie original, se obtendr seleccionando A1 A91,
C1 C91 y I1 I91 de la hoja Tendencia Modelo.
Con el icono de grficos
Asistente para Grficos (figura 1.5)
XY (Dispersin)
(3; 1), Dispersin con puntos conectados por lneas
Siguiente
Los autores, 2001; Edicions UPC, 2001.
p106 Series temporales
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo Serie y previsiones, tiempo y ventas, sacar
la leyenda y Siguiente
Paso 4: Situar el grfico como Objeto en la hoja Grficos. Terminar
Puede ser necesario editar el grfico por que la escala de abscisas vaya desde cero hasta
ochenta, y tambin modificar los tipos de lneas y puntos de la serie Y y de la serie
previsiones, para destacar claramente los dos grupos de puntos.
El resultado es el grfico de la pgina 114.
Conclusiones: Las previsiones siguen el mismo tipo de comportamiento que los datos
originales y, dada la bondad del modelo, pueden considerarse lo suficientemente fiables.
Pero, tenemos derecho a hacer previsiones de aqu a 18 das?; podramos hacer
previsiones a ms largo plazo? La prctica 2 nos dar herramientas para contestar a estas
preguntas.
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p107
1.8 Resultados
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
A B C D E F G H
Semana Dia Tiempo Y Y(p=6) Y mvil W Ind. Est
1 lunes 1 3968 -2342,52
1 martes 2 4572 -951,07
1 mircoles 3 3964 -1974,48
1 jueves 4 6326 6135,00 6103,75 222,25 293,63
1 viernes 5 9673 6072,50 6138,75 3534,25 3087,20
1 sbado 6 8307 6205,00 6188,25 2118,75 1887,24
2 lunes 7 3593 6171,50 6202,92 -2609,92 -2342,52
2 martes 8 5367 6234,33 6218,67 -851,67 -951,07
2 mircoles 9 3763 6203,00 6194,67 -2431,67 -1974,48
2 jueves 10 6703 6186,33 6196,67 506,33 293,63
2 viernes 11 9485 6207,00 6152,42 3332,58 3087,20
2 sbado 12 8207 6097,83 6079,08 2127,92 1887,24
3 lunes 13 3717 6060,33 5981,58 -2264,58 -2342,52
3 martes 14 4712 5902,83 5871,75 -1159,75 -951,07
3 mircoles 15 3538 5840,67 5781,83 -2243,83 -1974,48
3 jueves 16 5758 5723,00 5672,25 85,75 293,63
3 viernes 17 9112 5621,50 5626,42 3485,58 3087,20
3 sbado 18 7501 5631,33 5640,08 1860,92 1887,24
4 lunes 19 3108 5648,83 5720,33 -2612,33 -2342,52
4 martes 20 4771 5791,83 5774,75 -1003,75 -951,07
4 mircoles 21 3643 5757,67 5798,67 -2155,67 -1974,48
4 jueves 22 6616 5839,67 5882,17 733,83 293,63
4 viernes 23 8907 5924,67 5896,00 3011,00 3087,20
4 sbado 24 7993 5867,33 5923,25 2069,75 1887,24
5 lunes 25 3618 5979,17 5895,83 -2277,83 -2342,52
5 martes 26 4427 5812,50 5801,75 -1374,75 -951,07
5 mircoles 27 4314 5791,00 5735,08 -1421,08 -1974,48
5 jueves 28 5616 5679,17 5619,25 -3,25 293,63
5 viernes 29 8778 5559,33 5600,25 3177,75 3087,20
5 sbado 30 7322 5641,17 5633,83 1688,17 1887,24
6 lunes 31 2899 5626,50 5660,58 -2761,58 -2342,52
6 martes 32 4918 5694,67 5689,17 -771,17 -951,07
6 mircoles 33 4226 5683,67 5713,92 -1487,92 -1974,48
6 jueves 34 6025 5744,17 5786,58 238,42 293,63
6 viernes 35 8712 5829,00 5824,92 2887,08 3087,20
6 sbado 36 7685 5820,83 5767,75 1917,25 1887,24
7 lunes 37 3408 5714,67 5665,67 -2257,67 -2342,52
7 martes 38 4869 5616,67 5577,25 -708,25 -951,07
7 mircoles 39 3589 5537,83 5510,75 -1921,75 -1974,48
7 jueves 40 5437 5483,67 5442,58 -5,58 293,63
7 viernes 41 8239 5401,50 5348,83 2890,17 3087,20
7 sbado 42 7360 5296,17 5303,67 2056,33 1887,24
8 lunes 43 2915 5311,17 5363,08 -2448,08 -2342,52
8 martes 44 4237 5415,00 5458,00 -1221,00 -951,07
8 mircoles 45 3679 5501,00 5510,58 -1831,58 -1974,48
8 jueves 46 6060 5520,17 5525,50 534,50 293,63
8 viernes 47 8755 5530,83 5508,67 3246,33 3087,20
8 sbado 48 7475 5486,50 5454,17 2020,83 1887,24
9 lunes 49 2979 5421,83 5361,50 -2382,50 -2342,52
Hoja: Datos
Los autores, 2001; Edicions UPC, 2001.
p108 Series temporales
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
A B C D E F G H
9 martes 50 3971 5301,17 5270,92 -1299,92 -951,07
9 mircoles 51 3291 5240,67 5183,58 -1892,58 -1974,48
9 jueves 52 5336 5126,50 5173,17 162,83 293,63
9 viernes 53 8392 5219,83 5280,08 3111,92 3087,20
9 sbado 54 6790 5340,33 5326,08 1463,92 1887,24
10 lunes 55 3539 5311,83 5369,33 -1830,33 -2342,52
10 martes 56 4694 5426,83 5376,83 -682,83 -951,07
10 mircoles 57 3120 5326,83 5368,83 -2248,83 -1974,48
10 jueves 58 6026 5410,83 5387,08 638,92 293,63
10 viernes 59 7792 5363,33 5365,92 2426,08 3087,20
10 sbado 60 7294 5368,50 5377,42 1916,58 1887,24
11 lunes 61 3254 5386,33 5349,83 -2095,83 -2342,52
11 martes 62 4725 5313,33 5357,33 -632,33 -951,07
11 mircoles 63 3227 5401,33 5376,42 -2149,42 -1974,48
11 jueves 64 5588 5351,50 5349,42 238,58 293,63
11 viernes 65 8320 5347,33 5340,92 2979,08 3087,20
11 sbado 66 6995 5334,50 5353,08 1641,92 1887,24
12 lunes 67 3229 5371,67 5333,42 -2104,42 -2342,52
12 martes 68 4648 5295,17 5281,75 -633,75 -951,07
12 mircoles 69 3450 5268,33 5262,33 -1812,33 -1974,48
12 jueves 70 5129 5256,33 293,63
12 viernes 71 8159 3087,20
12 sbado 72 6923 1887,24
Promedio de W
dia Total Ind. Est
lunes -2331,37 -2342,5202
martes -939,924 -951,07323
mircoles -1963,33 -1974,4823
jueves 304,7803 293,631313
viernes 3098,348 3087,19949
sbado 1898,394 1887,24495
Total general 11,14899
Hoja: Datos (continuacin)
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p109
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
A B C D E F G H I
Tiempo Tiempo^2 Y Y mvil Ind. Est Tendencia Y mod Residuos Previsiones
1 1 3968 -2342,52 6284,39 3941,87 26,13
2 4 4572 -951,07 6257,63 5306,56 -734,56
3 9 3964 -1974,48 6231,23 4256,75 -292,75
4 16 6326 6103,75 293,63 6205,19 6498,82 -172,82
5 25 9673 6138,75 3087,20 6179,51 9266,71 406,29
6 36 8307 6188,25 1887,24 6154,19 8041,43 265,57
7 49 3593 6202,92 -2342,52 6129,23 3786,71 -193,71
8 64 5367 6218,67 -951,07 6104,63 5153,56 213,44
9 81 3763 6194,67 -1974,48 6080,39 4105,91 -342,91
10 100 6703 6196,67 293,63 6056,51 6350,14 352,86
11 121 9485 6152,42 3087,20 6032,99 9120,19 364,81
12 144 8207 6079,08 1887,24 6009,83 7897,07 309,93
13 169 3717 5981,58 -2342,52 5987,03 3644,51 72,49
14 196 4712 5871,75 -951,07 5964,59 5013,52 -301,52
15 225 3538 5781,83 -1974,48 5942,51 3968,03 -430,03
16 256 5758 5672,25 293,63 5920,79 6214,42 -456,42
17 289 9112 5626,42 3087,20 5899,43 8986,63 125,37
18 324 7501 5640,08 1887,24 5878,43 7765,67 -264,67
19 361 3108 5720,33 -2342,52 5857,79 3515,27 -407,27
20 400 4771 5774,75 -951,07 5837,51 4886,44 -115,44
21 441 3643 5798,67 -1974,48 5817,59 3843,11 -200,11
22 484 6616 5882,17 293,63 5798,03 6091,66 524,34
23 529 8907 5896,00 3087,20 5778,83 8866,03 40,97
24 576 7993 5923,25 1887,24 5759,99 7647,23 345,77
25 625 3618 5895,83 -2342,52 5741,51 3398,99 219,01
26 676 4427 5801,75 -951,07 5723,39 4772,32 -345,32
27 729 4314 5735,08 -1974,48 5705,63 3731,15 582,85
28 784 5616 5619,25 293,63 5688,23 5981,86 -365,86
29 841 8778 5600,25 3087,20 5671,19 8758,39 19,61
30 900 7322 5633,83 1887,24 5654,51 7541,75 -219,75
31 961 2899 5660,58 -2342,52 5638,19 3295,67 -396,67
32 1024 4918 5689,17 -951,07 5622,23 4671,16 246,84
33 1089 4226 5713,92 -1974,48 5606,63 3632,15 593,85
34 1156 6025 5786,58 293,63 5591,39 5885,02 139,98
35 1225 8712 5824,92 3087,20 5576,51 8663,71 48,29
36 1296 7685 5767,75 1887,24 5561,99 7449,23 235,77
37 1369 3408 5665,67 -2342,52 5547,83 3205,31 202,69
38 1444 4869 5577,25 -951,07 5534,03 4582,96 286,04
39 1521 3589 5510,75 -1974,48 5520,59 3546,11 42,89
40 1600 5437 5442,58 293,63 5507,51 5801,14 -364,14
41 1681 8239 5348,83 3087,20 5494,79 8581,99 -342,99
42 1764 7360 5303,67 1887,24 5482,43 7369,67 -9,67
43 1849 2915 5363,08 -2342,52 5470,43 3127,91 -212,91
44 1936 4237 5458,00 -951,07 5458,79 4507,72 -270,72
45 2025 3679 5510,58 -1974,48 5447,51 3473,03 205,97
46 2116 6060 5525,50 293,63 5436,59 5730,22 329,78
47 2209 8755 5508,67 3087,20 5426,03 8513,23 241,77
48 2304 7475 5454,17 1887,24 5415,83 7303,07 171,93
49 2401 2979 5361,50 -2342,52 5405,99 3063,47 -84,47
Hoja: TendenciaModelo
Los autores, 2001; Edicions UPC, 2001.
p110 Series temporales
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
A B C D E F G H I
50 2500 3971 5270,92 -951,07 5396,51 4445,44 -474,44
51 2601 3291 5183,58 -1974,48 5387,39 3412,91 -121,91
52 2704 5336 5173,17 293,63 5378,63 5672,26 -336,26
53 2809 8392 5280,08 3087,20 5370,23 8457,43 -65,43
54 2916 6790 5326,08 1887,24 5362,19 7249,43 -459,43
55 3025 3539 5369,33 -2342,52 5354,51 3011,99 527,01
56 3136 4694 5376,83 -951,07 5347,19 4396,12 297,88
57 3249 3120 5368,83 -1974,48 5340,23 3365,75 -245,75
58 3364 6026 5387,08 293,63 5333,63 5627,26 398,74
59 3481 7792 5365,92 3087,20 5327,39 8414,59 -622,59
60 3600 7294 5377,42 1887,24 5321,51 7208,75 85,25
61 3721 3254 5349,83 -2342,52 5315,99 2973,47 280,53
62 3844 4725 5357,33 -951,07 5310,83 4359,76 365,24
63 3969 3227 5376,42 -1974,48 5306,03 3331,55 -104,55
64 4096 5588 5349,42 293,63 5301,59 5595,22 -7,22
65 4225 8320 5340,92 3087,20 5297,51 8384,71 -64,71
66 4356 6995 5353,08 1887,24 5293,79 7181,03 -186,03
67 4489 3229 5333,42 -2342,52 5290,43 2947,91 281,09
68 4624 4648 5281,75 -951,07 5287,43 4336,36 311,64
69 4761 3450 5262,33 -1974,48 5284,79 3310,31 139,69
70 4900 5129 293,63 5282,51 5576,14 -447,14
71 5041 8159 3087,20 5280,59 8367,79 -208,79
72 5184 6923 1887,24 5279,03 7166,27 -243,27
73 -2342,52 5277,83 2935,31
74 -951,07 5276,99 4325,92
75 -1974,48 5276,51 3302,03
76 293,63 5276,39 5570,02
77 3087,20 5276,63 8363,83
78 1887,24 5277,23 7164,47
79 -2342,52 5278,19 2935,67
80 -951,07 5279,51 4328,44
81 -1974,48 5281,19 3306,71
82 293,63 5283,23 5576,86
83 3087,20 5285,63 8372,83
84 1887,24 5288,39 7175,63
85 -2342,52 5291,51 2948,99
86 -951,07 5294,99 4343,92
87 -1974,48 5298,83 3324,35
88 293,63 5303,03 5596,66
89 3087,20 5307,59 8394,79
90 1887,24 5312,51 7199,75
Resumen
stad st cos
R 0,92513
R^2 0,85587
R^2 ajust 0,85130
Error tpico 114,20021
n 66
ANOVA
u S de C C Va o p
Regresin 2 4879153,47 2439576,7 187,059889 3,1646E-27
Residuos 63 821626,351 13041,688
Total 65 5700779,82
Coefs o t p co t Va o p
Ord. Origen 6311,5139 51,8296 121,7743 1,7087E-76
Tiempo -27,3032 3,2473 -8,4079 6,9185E-12
Tiempo^2 0,1832 0,0433 4,2298 7,7177E-05
Hoja: TendenciaModelo (continuacin)
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p111

Evolucin cronolgica
0
4000
8000
12000
0 12 24 36 48 60 72
tiempo
V
e
n
t
a
s

Medias mviles (p=6)
0
4000
8000
12000
0 12 24 36 48 60 72
Tiempo
Hoja: Grficos
Los autores, 2001; Edicions UPC, 2001.
p112 Series temporales
Media mvil (tendencia)
5000
6000
7000
0 12 24 36 48 60 72
tiempo

Tendencia
5000
6000
7000
0 12 24 36 48 60 72
tiempo
Hoja: Grficos (continuacin)
Los autores, 2001; Edicions UPC, 2001.
Prctica 1. Descomposicin clsica de una serie aditiva p113
ndices estacionales
-3000
-2000
-1000
0
1000
2000
3000
4000
1 2 3 4 5 6

Modelo ajustado
0
4000
8000
12000
0 12 24 36 48 60 72
tiempo
V
e
n
t
a
s
Hoja: Grficos (continuacin)
Los autores, 2001; Edicions UPC, 2001.
p114 Series temporales

Residuos
-800
-400
0
400
800
0 12 24 36 48 60 72
tiempo

Serie y previsiones
0
2000
4000
6000
8000
10000
12000
0 30 60 90
tiempo
V
e
n
t
a
s
Hoja: Grficos (continuacin)
Los autores, 2001; Edicions UPC, 2001.
Prctica 2. Autocorrelacin y correlograma p115
PRCTICA 2. AUTOCORRELACIN Y CORRELOGRAMA
OBJETIVO: Con los datos del valor diario de la caja, resultado de las ventas de un
supermercado a lo largo de 12 semanas, que han sido analizados en la prctica anterior, se
han de calcular los coeficientes de autocorrelacin, estudiar su significacin estadstica y
obtener el correlograma; el objetivo final es ver hasta qu valor del tiempo se pueden hacer
previsiones.
Todo eso se realizar mediante la hoja de clculo Excel 97 de Microsoft.
2.1 Recuperacion de los datos
Desde Excel hay que recuperar el archivo que contiene los datos objeto de la prctica, y que
se encuentra en el directorio habitual de la red, siguiendo la secuencia,
Archivo 6 66 6 Abrir
y ahora ir al directorio donde se encuentra el archivo Practica 2.xls, seleccionarlo y
presionar sobre Abrir.
Una vez tenemos el archivo abierto, observamos que consta de una hoja llamada Datos
donde figuran 3 columnas de 72 valores cada una. En cada columna hay 72 valores, es
decir, empieza en la fila 1 (con el ttulo) y acaba en la 73. Recordemos que son los mismos
valores de la prctica 1.
2.2 Clculo de los coeficientes de autocorrelacin
Segn hemos visto en el texto sobre series temporales, el coeficiente de autocorrelacin se
calcula como
k
k
0

r s

donde
N k
i i k
i 1
k
(Y Y ) (Y Y )

+
=

=

y
N
2
i
i 1
0
(Y Y)

N
=

con la recomendacin de N > 50 y k N/4.


En el caso de la prctica, el nmero de observaciones es N = 72, hecho que nos permite
llegar hasta un valor de k igual a 18.
En primer lugar debemos disponer de los valores de la variable centrada, o sea de
i
Y Y . Escribimos Y Ybar como ttulo en la casilla D1, y en la D2 la expresin
= C2 - PROMEDIO(C$2:C$73)
Los autores, 2001; Edicions UPC, 2001.
p116 Series temporales
Observaremos que se ha fijado el conjunto de valores de Y (columna C) con el smbolo $,
con la finalidad de que al arrastrar la frmula no vayan cambiando los valores con los que se
calcula la media. Extendemos la expresin hasta D73.
En la casilla G1 escribimos como ttulo gamma_0, y en la G2 la expresin que permite
calcular su valor
= VARP(C2:C73)
Aqu se ha utilizado VARP en lugar de VAR para que el divisor sea N y no N1 como sera
en el otro caso.
Para comenzar a preparar la tabla de resultados, se titulan
F8 k G8 gamma_k H8 r_k I8 r_k^2
J8 V(r_k) K8 2S(r_k) L8 +2S(r_k)
En F9 se introduce el valor 1, y se arrastra en forma de incremento (presionando
simultneamente la tecla de Ctrl) hasta F26; aqu habr un 18.
En la columna G introducimos la expresin de la covariancia,
k
, de la pgina anterior, que
en el numerador tiene el producto escalar de dos vectores: el primero va desde Y
1
Y
hasta
72 K
Y Y

, o sea, de D2 a D(73k), y el segundo de Y


1+k
Y hasta Y
72
Y, o sea, de
D(2+k) a D73. Esto es un problema para arrastrar la frmula de una casilla a las siguientes,
ya que al aumentar el desplazamiento k un subndice aumenta, (el 2+k), pero el otro
disminuye, (el 73k). Este hecho obligar a escribir la frmula, arrastrarla y, despus,
manualmente, y casilla a casilla, modificar el contador que tiene que decrecer. Atenindonos
a ello en G9 debemos introducir la expresin de la covariancia para Kl, que se puede hacer
mediante la funcin SUMAPRODUCTO; es decir, presionaremos sobre el icono de
funciones y seleccionaremos, de entre las Matemticas y trigonomtricas, la
SUMAPRODUCTO (figura 2.1), que no es ms que el producto escalar de dos vectores,
Fig. 2.1
Los autores, 2001; Edicions UPC, 2001.
Prctica 2. Autocorrelacin y correlograma p117
En el cuadro siguiente (figura 2.2), especificaremos los valores que vamos a utilizar,
teniendo cuidado de fijar las posiciones inamovibles ($2 del primer vector y $73 por el
segundo), ya que, como se ha comentado, el primer vector siempre empieza en el primer
valor de la Y centrada, eso es, D2, mientras que el segundo siempre acaba en el ltimo
valor de Y centrada, o sea, D73. As el primer vector va de D$2 hasta D72 y el segundo de
D3 hasta D$73. Una vez se presiona la tecla Aceptar, en la ventana superior queda escrita
la expresin = SUMAPRODUCTO(D$2... D$73): dicha expresin hay que ponerla entre
parntesis y dividirla por el nmero total de observaciones (72 en este caso) a fin de obtener
la autocovariancia para k=1. En la figura 2.3 se muestra cmo finalmente queda definida la
casilla G9.
Fig. 2.2
Fig. 2.3
Esta expresin se debe arrastrar hasta G26 y, de momento, no hacer caso de lo que
resulte. Ahora hay que cambiar la posicin final del segundo elemento de la frmula en cada
casilla de esta columna. As
Los autores, 2001; Edicions UPC, 2001.
p118 Series temporales
Celda k expresin actual expresin definitiva
G10 2 =(SUMAPRODUCTO(D$2:D73 ... =(SUMAPRODUCTO(D$2:D71...
G11 3 =(SUMAPRODUCTO(D$2:D74 ... =(SUMAPRODUCTO(D$2:D70...

G25 17 =(SUMAPRODUCTO(D$2:D88 ... =(SUMAPRODUCTO(D$2:D56...
G26 18 =(SUMAPRODUCTO(D$2:D89 ... =(SUMAPRODUCTO(D$2:D55...
Observar los valores resultantes en la pgina 120.
En H9, escribir la expresin del coeficiente de autocorrelacin, eso es: = G9/G$2, y arrastrar
hasta H26, donde figurar =G26/G$2.
La columna I tiene los cuadrados de los coeficientes de autocorrelacin; para ello hay que
hacer I9 =H9*H9 y extenderlo hasta I26.
En la columna J se ha de calcular la variancia de cada coeficiente, que segn el texto de
teora es
1
1
V(r )
N
y
k 1
2
k i
i 1
1
V(r ) 1 2 r
N

=

+

Hacer J9 = 1/72
J10 = (1+2*SUMA(I$9:I9))/72
y arrastrar hasta J26 donde habr la expresin =(1+2*SUMA(I$9:I25))/72. Los extremos del
intervalo de no significacin, 2S(r_k), estarn en las columnas K y L.
K9 = 2*RAIZ(J9)
L9 = 2*RAIZ(J9)
Arrastrar estas expresiones hasta K26 y L26. La tabla completa de resultados est en las
pginas 120 y 121.
2.3 Autocorrelograma
El grfico se obtiene seleccionando F9 F26, H9 H26, K9 K26 y L9 L26.
Con el icono de grficos
Asistente para Grficos
XY (Dispersin)
(3; 1), Dispersin con puntos conectados por lneas
Siguiente
Paso 1: Siguiente
Los autores, 2001; Edicions UPC, 2001.
Prctica 2. Autocorrelacin y correlograma p119
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo Autocorrelograma, quitar la leyenda y
Siguiente
Paso 4: Situar el grfico con Objeto en la actual hoja Datos. Terminar
Situar el grfico en la posicin y el tamao deseado, y editarlo para que presente el aspecto
habitual de un correlograma.
Seleccionando un punto de la Serie 1, y haciendo clic con el botn derecho del ratn, sale el
cuadro de la figura 2.4. Seleccionar:

Tipo de grfico 6 Columnas Aceptar
Fig. 2.4
Igualmente, sobre un punto de la Serie 2, en la pantalla de la figura 2.4, hacer
Formato de serie de datos
Carpeta Tramas:
Z Lnea suavizada Marcador Ninguno
Repetir la misma operacin, una vez situados en un punto de la Serie 3.
Si es necesario, se pueden quitar decimales del eje de ordenadas; para eso tendremos que
situarnos sobre el Eje de valores, y entonces, con doble clic, o presionando el botn
derecho del ratn, seguir la secuencia
Formato de ejes
Carpeta Nmero Posiciones decimales
y para quitar los valores de k de dentro del grfico, en el Eje de categoras, eje de abscisas,
Formato de ejes
Carpeta Tramas Rtulos de marca de graduacin Ninguno
El resultado es el grfico de la pgina 121.
Comentarios: En el correlograma se confirma claramente la estacionalidad de perodo 6.
El coeficiente de autocorrelacin asociado a k=18 an es significativo, por eso se pueden
hacer previsiones para los prximos 18 das, o sea, 3 semanas de ventas.
Los autores, 2001; Edicions UPC, 2001.
p120 Series temporales
2.4 Resultados
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
A B C D E F G H I J K L
Seman Dia Y Y-Ybar gamma_0
1 lunes 3968 -1653,36 4003801
1 martes 4572 -1049,36
1 mircoles 3964 -1657,36
1 jueves 6326 704,639
1 viernes 9673 4051,64
1 sbado 8307 2685,64
2 lunes 3593 -2028,36 k gamma_k r_k r_k^2 V(r_k) - 2S(r_k) + 2S(r_k)
2 martes 5367 -254,361 1 1089260,8 0,2721 0,0740 0,0139 -0,2357 0,2357
2 mircoles 3763 -1858,36 2 -1528643 -0,3818 0,1458 0,0159 -0,2525 0,2525
2 jueves 6703 1081,64 3 -2302898 -0,5752 0,3308 0,0200 -0,2828 0,2828
2 viernes 9485 3863,64 4 -1654914 -0,4133 0,1708 0,0292 -0,3417 0,3417
2 sbado 8207 2585,64 5 873463,57 0,2182 0,0476 0,0339 -0,3684 0,3684
3 lunes 3717 -1904,36 6 3551137,5 0,8869 0,7867 0,0353 -0,3755 0,3755
3 martes 4712 -909,361 7 978459,2 0,2444 0,0597 0,0571 -0,4779 0,4779
3 mircoles 3538 -2083,36 8 -1429667 -0,3571 0,1275 0,0588 -0,4848 0,4848
3 jueves 5758 136,639 9 -2118164 -0,5290 0,2799 0,0623 -0,4992 0,4992
3 viernes 9112 3490,64 10 -1510880 -0,3774 0,1424 0,0701 -0,5294 0,5294
3 sbado 7501 1879,64 11 775336,95 0,1937 0,0375 0,0740 -0,5442 0,5442
4 lunes 3108 -2513,36 12 3213971,1 0,8027 0,6444 0,0751 -0,5480 0,5480
4 martes 4771 -850,361 13 902365,54 0,2254 0,0508 0,0930 -0,6098 0,6098
4 mircoles 3643 -1978,36 14 -1276624 -0,3189 0,1017 0,0944 -0,6144 0,6144
4 jueves 6616 994,639 15 -1892155 -0,4726 0,2233 0,0972 -0,6236 0,6236
4 viernes 8907 3285,64 16 -1373896 -0,3431 0,1178 0,1034 -0,6432 0,6432
4 sbado 7993 2371,64 17 700396,45 0,1749 0,0306 0,1067 -0,6533 0,6533
5 lunes 3618 -2003,36 18 2879249,8 0,7191 0,5171 0,1075 -0,6559 0,6559
5 martes 4427 -1194,36
5 mircoles 4314 -1307,36
5 jueves 5616 -5,36111
5 viernes 8778 3156,64
5 sbado 7322 1700,64
6 lunes 2899 -2722,36
6 martes 4918 -703,361
6 mircoles 4226 -1395,36
6 jueves 6025 403,639
6 viernes 8712 3090,64
6 sbado 7685 2063,64
7 lunes 3408 -2213,36
7 martes 4869 -752,361
7 mircoles 3589 -2032,36
7 jueves 5437 -184,361
7 viernes 8239 2617,64
7 sbado 7360 1738,64
8 lunes 2915 -2706,36
8 martes 4237 -1384,36
8 mircoles 3679 -1942,36
8 jueves 6060 438,639
8 viernes 8755 3133,64
8 sbado 7475 1853,64
9 lunes 2979 -2642,36
9 martes 3971 -1650,36
Hoja: Datos
Los autores, 2001; Edicions UPC, 2001.
Prctica 2. Autocorrelacin y correlograma p121
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
A B C D E F G H I J K L
9 mircoles 3291 -2330,36
9 jueves 5336 -285,361
9 viernes 8392 2770,64
9 sbado 6790 1168,64
10 lunes 3539 -2082,36
10 martes 4694 -927,361
10 mircoles 3120 -2501,36
10 jueves 6026 404,639
10 viernes 7792 2170,64
10 sbado 7294 1672,64
11 lunes 3254 -2367,36
11 martes 4725 -896,361
11 mircoles 3227 -2394,36
11 jueves 5588 -33,3611
11 viernes 8320 2698,64
11 sbado 6995 1373,64
12 lunes 3229 -2392,36
12 martes 4648 -973,361
12 mircoles 3450 -2171,36
12 jueves 5129 -492,361
12 viernes 8159 2537,64
12 sbado 6923 1301,64
Hoja: Datos (continuacin)
AUTOCORRELOGRAMA
-1,0
-0,5
0,0
0,5
1,0
Los autores, 2001; Edicions UPC, 2001.
p122 Series temporales
PRCTICA 3. MODELIZACIN DE UNA SERIE CON VARIABLES CATEGRICAS
OBJETIVO: Se dispone de la evolucin de un indicador econmico a lo largo de 62
trimestres. Tenemos que analizar los datos de esta serie cronolgica, estimar el modelo de
comportamiento con variables categricas, estudiar su ajuste y hacer las previsiones
pertinentes. Todo esto se realizar mediante la hoja de clculo Excel 97 de Microsoft.
3.1 Recuperacin de los datos
Desde Excel recuperar el archivo que contiene los datos objeto de la prctica, y que se
encuentran en el directorio habitual de la red. Por esto hemos de seguir la secuencia (figura
3.1):
Archivo 6 Abrir
Y ahora ir al directorio donde se encuentra el archivo Practica 3.xls, seleccionarlo y Abrir.
Fig. 3.1
Una vez tenemos el archivo abierto, observamos que consta de una hoja denominada Datos
donde figuran 2 columnas de 62 valores cada una, con la estructura mostrada parcialmente
en la figura 3.2. En cada columna hay 62 valores, es decir, se empieza en la fila 1 (con el
ttulo) y se acaba en la 63.
La columna A, llamada t, contiene valores de 1 a 62, correspondientes a los 62 intervalos de
tiempo (trimestres) en que se ha recogido la informacin, y la B, con el nombre de Y,
contiene los valores del indicador econmico que se est estudiando.
Fig. 3.2
Los autores, 2001; Edicions UPC, 2001.
Prctica 3. Modelizacin de una serie con variables categricas p123
3.2 Anlisis de la evolucin de la serie cronolgica
En primer lugar, hemos de analizar la evolucin de la serie, cosa que ya hemos hecho en la
prctica n1, pero es suficientemente rpido como para hacerlo de nuevo. Se selecciona
desde A1 hasta B63 (columnas t y Y) y se presiona el icono de grficos , o tambin,
en la barra de herramientas, Insertar y despus Grfico.
En el Asistente para Grficos (figura 3.3) hemos de seleccionar XY (Dispersin) y ahora
la opcin (3; 1), es decir, Dispersin con puntos de datos conectados con lneas y
Terminar.
Situar el grfico en el lugar que se desee, y editarlo segn convenga.
Fig. 3.3
El resultado es el primer grfico de la pgina 134 de esta prctica.
Parece detectarse una estacionalidad de perodo 4, hecho que debemos confirmar mediante
el correlograma. Este grfico ha sido el objetivo de la prctica 2; aplicando la metodologa
expuesta a los datos actuales resulta el correlograma mostrado en la pgina 132, donde se
puede ver, por una parte, la evidencia de una estacionalidad de perodo 4 y, por otra, que es
admisible hacer previsiones para cinco intervalos de tiempo.
Conclusiones: Se detecta una clara estacionalidad, de perodo p=4, y posiblemente una
tendencia creciente y cuadrtica. El modelo que se tendr que estudiar ser
Y =
0
+
1
t +
2
t
2
+
2
Q
2
+
3
Q
3
+
4
Q
4
+
5
Q
2
t +
6
Q
3
t +
7
Q
4
t +
Los autores, 2001; Edicions UPC, 2001.
p124 Series temporales
3.3 Modelizacin con variables categricas
Creacin de las variables
Para poder modelizar la serie, en primer lugar hemos de crear las variables categricas, o
indicatrices, teniendo en cuenta que, en el caso de la prctica, el perodo p es igual a 4.
Para ello, se preparan los ttulos de las columnas que contendrn los valores de las
variables categricas. Recordando que las representamos por Q y que sus ndices van
desde 2 hasta p (teora de series temporales), en las casillas C1, D1 y E1 escribiremos Q2,
Q3, y Q4, tal como muestra la figura 3.4.
A continuacin rellenaremos cada variable categrica con sus valores. Al ser el perodo igual
a 4, hay 4 combinaciones diferentes de ceros y unos, una para cada componente del
perodo, y sabiendo que Q
i
vale la unidad si el orden del tiempo asociado es igual a i, y vale
cero en cualquier otro caso, el conjunto de valores es el que se muestra en el bloque C2
E5, de la figura 3.4.
Una vez lleno el bloque anterior, slo hemos de seleccionarlo y con Cortar y Pegar, llenar
todas las casillas C ... E hasta la fila 63, o bien arrastrar el bloque presionando
simultneamente el Ctrl (pgina 130).
Adems, para estudiar el modelo, es necesario disponer de las columnas con los valores
tQ
2
, tQ
3
y tQ
4
, tiempo (t) y tiempo al cuadrado (t^2). Estos valores estn en las columnas F,
... J. Para llenar estas columnas, es ya evidente que lo que debemos hacer es definirlas
como
F2 = A2*C2, G2 = A2*D2, H2 = A2*E2, I2 =A2 y H2 = A2*A2.
Despus arrastrar hasta la fila 63. En la figura 3.4 se puede ver la estructura que toman
estas columnas, y en la pgina 130 todos los valores.
Es una exigencia de Excel que todas las columnas de los trminos que constituyen el
modelo hayan de ser consecutivas y contiguas.
Fig. 3.4
Los autores, 2001; Edicions UPC, 2001.
Prctica 3. Modelizacin de una serie con variables categricas p125
Obtencin del modelo
De acuerdo con la naturaleza de los datos hay que plantear el modelo
2
0 1 2 2 2 3 3 4 4 5 2 6 3 7 4

Y t t Q Q Q Q t Q t Q t = + + + + + + + +
Para estimar los coeficientes y estudiar su significacin, el procedimiento es:
Herramientas 6 66 6 Anlisis de datos 6 66 6 Regresin
En este momento aparece la pantalla de la figura 3.5, donde debemos rellenar los campos
siguientes
Rango Y de entrada: $B$1:$B$63 (los valores de Y)
Rango X de entrada: $C$1:$J$63 (los valores de los regresores)
Z Rtulos
n Rango de salida $A$125 (una casilla que est vaca)
Los resultados se pueden ver en la pgina 133, con el ttulo Primer paso
Conclusiones: El coeficiente del trmino Q2 no es significativo (su nivel de significacin es p
= 0,292 > 0,05). Debemos eliminarlo del modelo lineal y volver a estimar los coeficientes.
Fig. 3.5
Los autores, 2001; Edicions UPC, 2001.
p126 Series temporales
Para eliminar el trmino Q2 y rehacer la regresin, con la rutina Regresin de Excel, es
necesario que todos los trminos del modelo estn juntos; por tanto hemos de eliminar la
columna de Q2. Hacerlo as directamente podra ocasionar problemas y modificaciones en
otras columnas ligadas a sta. Para evitarlo recomendamos lo siguiente:
Seleccionar con el ratn desde B1 hasta J63, presionar el botn derecho y hacer
Copiar.
Situarse, por ejemplo, en la casilla S1 (fila a partir de la cual todo est vaco) y
desplegar el men Insertar (figura 3.6).
Fig. 3.6
Seleccionar Pegado especial y ahora Valores (figura 3.7)
Fig. 3.7
Los autores, 2001; Edicions UPC, 2001.
Prctica 3. Modelizacin de una serie con variables categricas p127
Ahora eliminar la columna asociada a Q2 (la T en el caso del ejemplo): para ello se
pincha sobre la letra T distintiva de la columna, que quedar enmarcada por una lnea
que parpadea; entonces se presiona el botn derecho y se selecciona Eliminar. De
esta manera las columnas siguientes avanzan un lugar y vuelven a estar todas juntas,
es decir, empiezan en la S (valores de Y) y acaban en la Z (valores de t^2)
Y ahora hay que proceder como antes:
Herramientas 6 66 6 Anlisis de datos 6 66 6 Regresin
modificando los campos siguientes:
Rango X de entrada: $S$1:$Z$63 (los nuevos regresores)
n Rango de salida $A$150 (una casilla que est vaca)
Los resultados se pueden ver en la pgina 133 con el ttulo Segundo paso
Conclusiones: El modelo definitivo es

Y = 97,81 + 2,03 t + 0,014 t


2
7,75 Q
3
+ 20,57 Q
4
+ 0,39 t Q
2
+ 0,85 t Q
3
+ 0,99 t Q
4
Analizar y comentar los valores de los coeficientes del modelo, su significacin y el valor
del coeficiente de determinacin (R^2) del ajuste.
3.4 Estimaciones y residuos
Valores estimados
Una vez establecido el modelo tenemos que examinar el ajuste entre los datos y los valores
estimados segn el modelo ajustado.
Por eso, en primer lugar cogemos un bloque con los trminos y los coeficientes del modelo
definitivamente obtenido y hacemos un Cortar y Pegar en L2; en L1 escribimos Modelo:
resultarn las casillas destacadas en azul en la pgina 131.
Despus, en N1 escribimos el ttulo de la columna, Yest, y en N2 el modelo, es decir
= M$2+M$3*D2+M$4*E2+M$5*F2+M$6*G2+M$7*H2+M$8*I2+M$9*J2
Debemos destacar la exigencia de fijar las celdas que contienen los coeficientes del modelo,
para que al arrastrar la frmula se mantengan constantes.
Arrastrando la casilla N2 hasta la N63 se obtienen los valores calculados, como
estimaciones de la variable estudiada, que se pueden ver en la pgina 131.
Los autores, 2001; Edicions UPC, 2001.
p128 Series temporales
Grfico de los valores reales enfrente de los estimados
Es necesario seleccionar desde B2 hasta B63 y, presionando la tecla Ctrl, desde N2 hasta
N63. Despus se presiona el icono de los grficos y
Asistente para Grficos
Lneas
(2, 1) Lnea con marcadores Terminar
Situaremos el grfico como Objeto en la misma hoja, y lo editaremos, en la posicin, la
amplitud y el estilo deseados. El resultado se puede ver en el segundo grfico de la
pgina 134.
Grfico de residuos
En primer lugar debemos calcular los residuos; para esto es prepara la columna con el
ttulo y se calculan los valores:
O1 : Res O2 = B2 N2 (arrastrar hasta O63 (pgina 131))
Para hacer el grfico se selecciona desde O2 hasta O63, se presiona y
Asistente para Grficos
Lneas
(2, 1) Lnea con marcadores Terminar
Situaremos el grfico como Objeto en la misma hoja, y lo editaremos, en la posicin, la
amplitud y el estilo deseados. El resultado se puede ver en el primer grfico de la pgina
135.
Conclusiones: Observar y analizar detalladamente la evolucin de los dos grficos.
3.5 Previsiones
Atendiendo a que, segn el correlograma (pgina 132), se pueden hacer previsiones para
los prximos 5 valores del tiempo, es necesario ampliar las columnas de las variables
categricas y del tiempo con los 5 valores nuevos, del 63 hasta el 67. Estos valores se han
de incorporar al final de la columna A, es decir desde A64 hasta A68 (pgina 130).
El primer valor para el que hay que hacer previsiones corresponde a t = 63, que es un
mltiple de 4 (154 = 60) ms 3. Por tanto, la variable categrica Q3 valdr 1 y las dems 0.
Situados en C64 podemos copiar el bloque C4 E8, que es el de las categricas que se
inicia en una tercera estacin. Ahora seleccionaremos con el ratn desde F63 hasta J63 y
arrastraremos hasta llenar la fila 68, que corresponde a la ltima previsin (pgina 130).
Los autores, 2001; Edicions UPC, 2001.
Prctica 3. Modelizacin de una serie con variables categricas p129
Prepararemos la columna de las previsiones:
K1 = Y Prev (ttulo)
y en K64 escribiremos el modelo , es decir,
=M$2+M$3*D64+M$4*E64+M$5*F64+M$6*G64+M$7*H64+M$8*I64+M$9*J64
arrastraremos hasta K68 y tendremos los valores de las 5 previsiones (pgina131).
Para hacer el grfico se selecciona desde B2 hasta B68 y, presionando el Ctrl, desde K2
hasta K68 y desde N2 hasta N68. Se presiona el icono de los grficos y
Asistente para Grficos
Lneas
(2, 1) Lnea con marcadores
Terminar
Situaremos el grfico como Objeto en la misma hoja, y lo editaremos, en la posicin, el
tamao y el estilo deseados. El resultado se puede ver en el segundo grfico de la pgina
135.
Conclusiones: Analizar detalladamente el grfico de las observaciones y las previsiones.
Pensando que los datos corresponden a un indicador econmico medido trimestralmente,
comentar su evolucin actual y futura as como el comportamiento diferencial propio de
cada trimestre.
Los autores, 2001; Edicions UPC, 2001.
p130 Series temporales
3.6 Resultados
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
A B C D E F G H I J
t Y Q2 Q3 Q4 tQ2 tQ3 tQ4 t t^2
1 105,86 0 0 0 0 0 0 1 1
2 97,79 1 0 0 2 0 0 2 4
3 96,1 0 1 0 0 3 0 3 9
4 127,44 0 0 1 0 0 4 4 16
5 108,78 0 0 0 0 0 0 5 25
6 112,61 1 0 0 6 0 0 6 36
7 111,43 0 1 0 0 7 0 7 49
8 145,71 0 0 1 0 0 8 8 64
9 118,37 0 0 0 0 0 0 9 81
10 121,89 1 0 0 10 0 0 10 100
11 124,25 0 1 0 0 11 0 11 121
12 159,55 0 0 1 0 0 12 12 144
13 125,41 0 0 0 0 0 0 13 169
14 135,4 1 0 0 14 0 0 14 196
15 137,86 0 1 0 0 15 0 15 225
16 171,44 0 0 1 0 0 16 16 256
17 132,38 0 0 0 0 0 0 17 289
18 147,59 1 0 0 18 0 0 18 324
19 153,92 0 1 0 0 19 0 19 361
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
A B C D E F G H I J
49 232,76 0 0 0 0 0 0 49 2401
50 256,84 1 0 0 50 0 0 50 2500
51 271,36 0 1 0 0 51 0 51 2601
52 311,42 0 0 1 0 0 52 52 2704
53 243,9 0 0 0 0 0 0 53 2809
54 268,42 1 0 0 54 0 0 54 2916
55 291,25 0 1 0 0 55 0 55 3025
56 331,96 0 0 1 0 0 56 56 3136
57 255,46 0 0 0 0 0 0 57 3249
58 283,53 1 0 0 58 0 0 58 3364
59 307,82 0 1 0 0 59 0 59 3481
60 354,72 0 0 1 0 0 60 60 3600
61 276,58 0 0 0 0 0 0 61 3721
62 304,72 1 0 0 62 0 0 62 3844
63 0 1 0 0 63 0 63 3969
64 0 0 1 0 0 64 64 4096
65 0 0 0 0 0 0 65 4225
66 1 0 0 66 0 0 66 4356
67 0 1 0 0 67 0 67 4489
Hoja: Datos
Los autores, 2001; Edicions UPC, 2001.
Prctica 3. Modelizacin de una serie con variables categricas p131
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
K L M N O
Y Prev Modelo Y est Res
Ord. Origen 97,8112 99,856 6,004
Q3 -7,7472 102,701 -4,911
Q4 20,5667 98,828 -2,728
tQ2 0,3863 130,677 -3,237
tQ3 0,8484 108,319 0,461
tQ4 0,9877 112,823 -0,213
t 2,0302 110,913 0,517
t^2 0,0143 143,433 2,277
117,238 1,132
123,402 -1,512
123,454 0,796
156,645 2,905
126,613 -1,203
134,437 0,963
136,451 1,409
170,314 1,126
136,445 -4,065
145,928 1,662
149,905 4,015
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
K L M N O
231,526 1,234
254,283 2,557
273,960 -2,600
313,863 -2,443
245,464 -1,564
269,881 -1,461
291,520 -0,270
332,095 -0,135
259,859 -4,399
285,935 -2,405
309,537 -1,717
350,782 3,938
274,710 1,870
302,445 2,275
328,010
369,926
290,018
319,412
346,939
Hoja: Datos (continuacin)
Los autores, 2001; Edicions UPC, 2001.
p132 Series temporales
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
A B C D E F G H I J K
t Y Y-Ybar gamma_0
1 105,86 -94,918 4277,898
2 97,79 -102,988
3 96,1 -104,678
4 127,44 -73,338 k gamma_k r_k r_k^2 V(r_k) - 2S(r_k) + 2S(r_k)
5 108,78 -91,998 1 3562,405 0,833 0,693 0,016 -0,254 0,254
6 112,61 -88,168 2 3408,788 0,797 0,635 0,038 -0,392 0,392
7 111,43 -89,348 3 3149,145 0,736 0,542 0,059 -0,486 0,486
8 145,71 -55,068 4 3466,645 0,810 0,657 0,076 -0,553 0,553
9 118,37 -82,408 5 2791,202 0,652 0,426 0,098 -0,625 0,625
10 121,89 -78,888 6 2671,875 0,625 0,390 0,111 -0,667 0,667
11 124,25 -76,528 7 2435,804 0,569 0,324 0,124 -0,704 0,704
12 159,55 -41,228 8 2711,854 0,634 0,402 0,134 -0,733 0,733
13 125,41 -75,368 9 2076,334 0,485 0,236 0,147 -0,768 0,768
14 135,4 -65,378 10 1964,898 0,459 0,211 0,155 -0,787 0,787
15 137,86 -62,918 11 1745,883 0,408 0,167 0,162 -0,804 0,804
16 171,44 -29,338 12 1990,675 0,465 0,217 0,167 -0,818 0,818
17 132,38 -68,398 13 1385,336 0,324 0,105 0,174 -0,835 0,835
18 147,59 -53,188 14 1281,548 0,300 0,090 0,178 -0,843 0,843
19 153,92 -46,858 15 1082,582 0,253 0,064 0,180 -0,850 0,850
20 179,39 -21,388 16 1282,895 0,300 0,090 0,182 -0,854 0,854
21 141,59 -59,188 17 717,469 0,168 0,028 0,185 -0,861 0,861
22 159,6 -41,178 18 636,614 0,149 0,022 0,186 -0,863 0,863
23 163,23 -37,548
24 205,54 4,762
25 161,71 -39,068
26 172,24 -28,538
27 173,17 -27,608
AUTOCORRELOGRAMA
-1,0
-0,5
0,0
0,5
1,0
Hoja: Correl
Los autores, 2001; Edicions UPC, 2001.
Prctica 3. Modelizacin de una serie con variables categricas p133
Resultados de la regresin
Primer paso
Coef. de determinacin
R^2 0,99803327
ANLISIS DE VARIANZA
nu S.C. C.M. F p-val
Regresin 8 264708,064 33088,508 3361,908 7,37E-69
Residuos 53 521,636 9,842
Total 61 265229,699
Coefs Error tpico t p-val
Ord. Origen 98,9145 1,7628 56,1129 6,95E-49
Q2 -2,3396 2,1976 -1,0646 2,92E-01
Q3 -8,8900 2,2637 -3,9271 2,50E-04
Q4 19,4201 2,2980 8,4508 2,15E-11
tQ2 0,4416 0,0602 7,3341 1,31E-09
tQ3 0,8756 0,0633 13,8337 3,15E-19
tQ4 1,0150 0,0634 16,0203 5,78E-22
t 2,0067 0,0965 20,7852 3,82E-27
t^2 0,0142 0,0014 10,1580 4,85E-14
Segundo paso
Coef. de determinacin
R^2 0,99799121
ANLISIS DE VARIANZA
nu S.C. C.M. F p-val
Regresin 7 264696,908 37813,844 3832,546 2,00E-70
Residuos 54 532,791 9,867
Total 61 265229,699
Coefs Error tpico t p-val
Ord. Origen 97,8112 1,4278 68,5071 3,52E-54
Q3 -7,7472 1,9955 -3,8823 2,84E-04
Q4 20,5667 2,0325 10,1186 4,50E-14
tQ2 0,3863 0,0304 12,6897 7,78E-18
tQ3 0,8484 0,0580 14,6299 1,97E-20
tQ4 0,9877 0,0580 17,0261 2,29E-23
t 2,0302 0,0941 21,5725 3,26E-28
t^2 0,0143 0,0014 10,1963 3,42E-14
Los autores, 2001; Edicions UPC, 2001.
p134 Series temporales

Evolucin cronolgica de los datos
90
130
170
210
250
290
330
370
0 8 16 24 32 40 48 56 64
t
Y

Datos reales y modelizados
90
130
170
210
250
290
330
370
0 8 16 24 32 40 48 56 64 t
Y
Serie1 Serie2 Real Model
Los autores, 2001; Edicions UPC, 2001.
Prctica 3. Modelizacin de una serie con variables categricas p135

Residuos
-10
-5
0
5
10
0 8 16 24 32 40 48 56 64
t
R

Valores reales, modelizados y previsiones
90
130
170
210
250
290
330
370
410
0 8 16 24 32 40 48 56 64 72
t
Y
Serie1 Serie2 Serie3 Real Model
Prev
Los autores, 2001; Edicions UPC, 2001.
p136 Series temporales
PRCTICA 4. MODELIZACIN Y PREVISIONES POR SUAVIZADO EXPONENCIAL
(MTODO DE BROWN)
OBJETIVO: Se dispone de la evolucin de un indicador econmico durante 31 das. Hay que
analizar los datos de esta serie cronolgica, estimar el modelo de comportamiento y hacer
las previsiones pertinentes. Todo esto se realizar mediante la hoja de clculo Excel 97 de
Microsoft.
4.1 Recuperacin de los datos
Desde Excel recuperar el archivo que contiene los datos objeto de la prctica, y que se
encuentran en el directorio habitual de la red. Para ello, debemos seguir la secuencia (figura
4.1)
Archivo 6 Abrir
y ahora ir al directorio donde se encuentra el archivo Prctica 4.xls, seleccionarlo y
presionar Abrir.
Fig. 4.1
Una vez est abierto el archivo, observamos que consta de una hoja denominada Datos con
2 columnas de 31 valores cada una y la estructura mostrada en la figura 4.2.
La columna A, llamada Tiempo, contiene valores de 1 a 31 y la B, llamada Y, contiene los
valores del ndice econmico que se est estudiando.
Fig. 4.2
Los autores, 2001; Edicions UPC, 2001.
Prctica 4. Modelizacin y previsiones por suavizado exponencial p137
4.2 Anlisis de la evolucin de la serie cronolgica
En primer lugar, hay que analizar la evolucin de la serie: para ello se selecciona desde B1
hasta B32 (valores de Y) y se presiona el icono de grficos , o tambin, en la barra de
herramientas, Insertar y despus Grfico. En el Asistente para Grficos (figura 4.3),
seleccionar Lneas.
Fig. 4.3
Y ahora la opcin (2; 1), es decir, Lnea con marcadores en cada valor de datos y
Terminar.
Situar el grfico como Objeto en la misma hoja, y editarlo en la posicin y el tamao
deseados.
El resultado es el grfico de la pgina 142.
Se muestra una tendencia creciente y no parece detectarse ningn tipo de estacionalidad,
cosa que se confirmar mediante el correlograma. Este grfico ha sido el objetivo de la
prctica 2; para obtenerlo copiamos todos los datos de la prctica en una nueva hoja que
llamaremos Correl. Aplicando la sistemtica se obtienen los resultados mostrados en la
pginas 143 y 144, que confirman la no estacionalidad y la posibilidad de hacer previsiones
para los tres prximos das. Se debe recalcar que no se est en las mejores condiciones
para hacer un correlograma, porque tan slo se dispone de 30 valores.
Conclusiones: Sin estacionalidad y con tendencia creciente, se puede estudiar la serie
aplicando el suavizado exponencial segn el mtodo de Brown que incorpora una tendencia
rectilnea y cambiante a lo largo del tiempo.
Los autores, 2001; Edicions UPC, 2001.
p138 Series temporales
4.3 Mtodo de Brown
Para modelizar una serie con este procedimiento hemos de seleccionar un valor del
parmetro y calcular la serie suavizada, la doble suavizada, la ordenada en el origen, la
pendiente, el valor de la serie estimada, el error en cada instante y el error cuadrtico medio.
Cambiando el valor de se repite el proceso y se selecciona, como parmetro de
modelizacin, el que minimice el error cuadrtico medio.
Seleccin de
En la casilla A40 escribimos el valor inicial de , = 0,1 para empezar, y etiquetamos las
columnas segn el contenido que tenemos destinado. As:
A B C D E F G H I
1 Tiempo Y S S(2) a^ b^ Y est Error Y prevista
2
Las expresiones utilizadas sern segn el texto de series temporales, y su ubicacin en la
hoja de clculo ser:
casilla Expresin
S
1
= Y
1
S
t
= Y
t
+ ( 1 - ) S
t

1
C2
C3
= B2
= $A$40*B3+(1 $A$40)*C2 arrastrar hasta C32
S
1
(2)
= Y
1
S
t
(2)
= S
t
+ ( 1 - ) S
t

1
(2)
D2
D3
= B2
= $A$40*C3+(1 $A$40)*D2 arrastrar hasta D32
(2)
t t t
a 2S S =
E2 = 2*C2 D2 arrastrar hasta E32
(2)
t t

b (S S )
1

F2 = ($A$40/(1 $A$40))*(C2 D2) arrastrar hasta F32


t t 1 t 1

Y a b

= +
G3 = E2+F2 arrastrar hasta G32
t t t t

R e Y Y = = H3 = B3 G3 arrastrar hasta H32


La casilla G33 se etiqueta como ECM para escribir en H34 la expresin
= SUMA.CUADRADOS(H3:H32) / 30 (error cuadrtico medio)
Observaremos que se dispone de 31 valores de la serie y slo hay 30 estimaciones y, por
tanto, 30 errores.
Los autores, 2001; Edicions UPC, 2001.
Prctica 4. Modelizacin y previsiones por suavizado exponencial p139
Se deben guardar los valores de cada y su ECM, a fin de escoger la ptima. En casillas
vacas preparamos una tabla como la que muestra la figura 4.4, donde etiquetamos C40
como Lambda y D40 como E.C.M. A continuacin escribimos en C41 el valor 0,1 (
utilizada en los clculos) y en D41 7,777, valor resultante de ECM segn ha salido en la
casilla H34. (Esto lo podemos hacer manualmente o con Cortar y Pegar slo valores).
Sustituyendo el valor de de la casilla A40 por 0,2, automticamente cambiarn todos los
valores de los clculos de las columnas C H. Ahora anotamos 0,2 en C42 y el valor de
H34 (2,679 en este caso) en D42.
Sucesivamente se van cambiando los valores de (A40) por 0,3, 0,9, y anotando junto
con sus ECM, desde C43 D43 hasta C49 D49. Con los datos actuales, se detecta que el
ptimo estar entre 0,4 y 0,5; por tanto, ponemos 0,45 en A40 y lo pasamos a C50
juntamente con su ECM (H34), que en este caso es igual a 1,822 y que anotamos en D50.
39
40
41
42
43
44
45
46
47
48
49
50
51
A B C D E F G H
0,45 Lambda E.C.M.
0,1 7,777
0,2 2,679
0,3 1,989
0,4 1,836
0,5 1,833
0,6 1,917
0,7 2,077
0,8 2,321
0,9 2,669
0,45 1,822
0
2
4
6
8
0 0,5 1
ECM

Fig. 4.4
Previsiones
Una vez escogida la de trabajo, se puede pasar a calcular los valores previstos para los
prximos tres das, segn se ha deducido del correlograma. Por eso prolongamos la
columna A con los tres nuevos valores del tiempo (A33 = 32; A34 =33; A35 = 34).
El valor previsto para el instante t + T (31+T, en el caso de la prctica) es
t T t t

Y a b T
+
= +
#
En la casilla I33, perteneciente a la columna I etiquetada como Y prevista, se deber
escribir la expresin
= E$32+F$32*(A33-A$32)
Los autores, 2001; Edicions UPC, 2001.
p140 Series temporales
y arrastrarla hasta I35. As acabamos de calcular los valores previstos para los prximos tres
das del ndice econmico estudiado. Todos los resultados se muestran en la pgina 141.
Anlisis de los grficos
Seguidamente, y como ya es habitual, se proceder a la obtencin del grfico de los valores
reales, los modelizados y los previstos, y del grfico de los errores.
Para ello se selecciona, presionando la tecla Ctrl, desde B1 hasta B32 (valores de Y), desde
G1 hasta G32 (valores de Y estimada) y desde I1 hasta I35 (valores de Y prevista), y se
presiona el icono de grficos , o tambin, en la barra de herramientas, Insertar y
despus Grfico.
En el Asistente para Grficos seleccionar
XY (Dispersin)
(3,1) Dispersin con puntos de datos conectados por lneas
Terminar
Situaremos el grfico como Objeto en la misma hoja, y lo editaremos en la posicin y el
tamao deseados. El resultado es el grfico de la pgina 142.
Para obtener el grfico de los errores se procede seleccionando desde H1 hasta H32
(valores de los errores) y exactamente igual que en el grfico anterior. El resultado es el
grfico de la pgina 143.
Conclusiones: Las previsiones siguen muy bien todos los datos, a lo largo del tiempo de
recogida de informacin. Los errores no muestran ninguna particularidad destacable.
Los autores, 2001; Edicions UPC, 2001.
Prctica 4. Modelizacin y previsiones por suavizado exponencial p141
4.4 Resultados
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
A B C D E F G H I
Tiempo Y S S(2) a^ b^ Y est Error Y prevista
1 9,51 9,51 9,51 9,51 0,00
2 7,71 8,70 9,15 8,25 -0,36 9,51 -1,800
3 6,39 7,66 8,48 6,84 -0,67 7,89 -1,500
4 6,67 7,21 7,91 6,52 -0,57 6,18 0,494
5 9,14 8,08 7,99 8,18 0,08 5,95 3,188
6 7,66 7,89 7,94 7,84 -0,04 8,25 -0,593
7 7,74 7,82 7,89 7,76 -0,05 7,80 -0,057
8 9,36 8,51 8,17 8,86 0,28 7,70 1,657
9 10,03 9,20 8,63 9,76 0,46 9,14 0,890
10 8,38 8,83 8,72 8,94 0,09 10,22 -1,842
11 7,12 8,06 8,42 7,70 -0,30 9,03 -1,906
12 9,06 8,51 8,46 8,56 0,04 7,40 1,661
13 9,6 9,00 8,70 9,30 0,24 8,60 1,004
14 11,44 10,10 9,33 10,86 0,63 9,54 1,901
15 10,93 10,47 9,85 11,10 0,51 11,49 -0,562
16 13,1 11,65 10,66 12,65 0,81 11,61 1,487
17 13,51 12,49 11,48 13,50 0,82 13,46 0,045
18 13,93 13,14 12,23 14,05 0,74 14,32 -0,390
19 13,54 13,32 12,72 13,92 0,49 14,79 -1,253
20 15,65 14,37 13,46 15,27 0,74 14,41 1,240
21 15,13 14,71 14,02 15,40 0,56 16,02 -0,887
22 17,06 15,77 14,81 16,73 0,79 15,96 1,099
23 19,03 17,24 15,90 18,57 1,09 17,51 1,517
24 21,38 19,10 17,34 20,86 1,44 19,66 1,717
25 22,82 20,77 18,89 22,66 1,55 22,30 0,519
26 22,76 21,67 20,14 23,20 1,25 24,21 -1,448
27 23,02 22,28 21,10 23,45 0,96 24,45 -1,430
28 23,62 22,88 21,90 23,86 0,80 24,41 -0,795
29 23,45 23,14 22,46 23,82 0,56 24,66 -1,212
30 24,57 23,78 23,05 24,51 0,60 24,37 0,197
31 24,17 23,96 23,46 24,45 0,41 25,11 -0,936
32 ECM = 1,822 24,86
33 25,27
34 25,67
0,45 Lambda E.C.M.
0,1 7,777
0,2 2,679
0,3 1,989
0,4 1,836
0,5 1,833
0,6 1,917
0,7 2,077
0,8 2,321
0,9 2,669
0,45 1,822
0
2
4
6
8
0 0,5 1
ECM

Hoja: Datos
Los autores, 2001; Edicions UPC, 2001.
p142 Series temporales
Evolucin cronolgica
0
10
20
30
0 10 20 30 40
Tiempo
Y
Valores medidos y previsiones
0
10
20
30
0 10 20 30 40
Tiempo
Y Y est Y prevista
Los autores, 2001; Edicions UPC, 2001.
Prctica 4. Modelizacin y previsiones por suavizado exponencial p143
Errores
-3
-2
-1
0
1
2
3
4
0 10 20 30 40
Tiempo

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
A B C D E F G H I J K
Tiempo
Y Y - Ybar gamma_0
1 9,51 -4,602 37,975
2 7,71 -6,402
3 6,39 -7,722
4 6,67 -7,442
5 9,14 -4,972
6 7,66 -6,452
7 7,74 -6,372 k gamma_k r_k r_k^2 V(r_k) -2S(r_k) +2S(r_k)
8 9,36 -4,752 1 35,107 0,924 0,855 0,032 -0,359 0,359
9 10,03 -4,082 2 31,592 0,832 0,692 0,087 -0,591 0,591
10 8,38 -5,732 3 28,034 0,738 0,545 0,132 -0,727 0,727
11 7,12 -6,992 4 24,355 0,641 0,411 0,167 -0,818 0,818
12 9,06 -5,052 5 20,478 0,539 0,291 0,194 -0,880 0,880
13 9,6 -4,512 6 16,437 0,433 0,187 0,213 -0,922 0,922
14 11,44 -2,672 7 12,353 0,325 0,106 0,225 -0,948 0,948
15 10,93 -3,182 8 8,665 0,228 0,052 0,231 -0,962 0,962
16 13,1 -1,012 9 5,129 0,135 0,018 0,235 -0,969 0,969
17 13,51 -0,602 10 1,730 0,046 0,002 0,236 -0,972 0,972
18 13,93 -0,182
19 13,54 -0,572
20 15,65 1,538
21 15,13 1,018
22 17,06 2,948
23 19,03 4,918
24 21,38 7,268
25 22,82 8,708
26 22,76 8,648
27 23,02 8,908
28 23,62 9,508
29 23,45 9,338
30 24,57 10,458
31 24,17 10,058
Hoja: Correl
Los autores, 2001; Edicions UPC, 2001.
p144 Series temporales
Autocorrelograma
-1,0
-0,5
0,0
0,5
1,0
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p145
EVALUACIONES DE SERIES TEMPORALES
NDICE TEMTICO
1. DESCOMPOSICIN CLSICA
13.5.98................................................................... 1 2 3 4
3.5.99..................................................................... 1 2 3
23.6.99................................................................... 1 2 6
12.1.00................................................................... 1 2 3
17.5.00................................................................... 1 2 10
2. MODELIZACIN CON VARIABLES CATEGRICAS
13.5.98................................................................... 7 8 9
3.5.99..................................................................... 4 5 6
23.6.99................................................................... 3 4
12.1.00................................................................... 4 5
17.5.00................................................................... 3 4 5
3. AUTOCORRELACIN
13.5.98................................................................... 5 10
3.5.99..................................................................... 7
23.6.99................................................................... 7
12.1.00................................................................... 6 7
17.5.00................................................................... 6 7
4. SUAVIZADO EXPONENCIAL
13.5.98................................................................... 6
3.5.99..................................................................... 8 9 10
23.6.99................................................................... 5 8
12.1.00................................................................... 8 9
17.5.00................................................................... 8 9
Los autores, 2001; Edicions UPC, 2001.
p146 Series temporales
1 EVALUACIONES PROPUESTAS
Respuesta correcta +1; incorrecta 0,2
? 1. El modelo de tendencia ha sido T = 76,23 + 0,54 t 0,02 t
2
. Los respectivos niveles de
significacin de los trminos t y t
2
han sido 0,002 y 0,423. El modelo definitivo es
76,23+0,54t0,02t
2
76,23+0,54t Hay que recalcularlo ..
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p147
13.5.98
? 1 Los valores disponibles de una serie temporal son: 11,2; 13,4; 9,9; 11,9; 14,2; 11,0; 13,1; 14,8;
12,2; 14,1; 16,3; .... Se trata de un modelo:
multiplicativo tendencia rectilnea estacionalidad de p=2
aditivo tendencia parablica estacionalidad de p=3
. . . . . . . . . . ninguna tendencia estacionalidad de p=4
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
? 2 Por los datos anteriores, el valor de la tercera media mvil es:
11,75 12 12,15 13,36 . . . . . . . . . .
? 3 Los primeros datos de una serie multiplicativa p = 4 son: 32; 26; 22; 45; 52; 42; 29; ... El valor
de la media mvil asociada a t = 4 es:
31,25 36,25 38,25 40,25 . . . . . . . . . .
? 4 En una serie multiplicativa de p = 4,
* * * *
1 2 3 4
= 43.4 = 37.9 = 52.5 = 66.2
E E E E
; cul es el
valor de E
3
?
2.5 44.6 52.5 105 . . . . . . . . . .
? 5. Sobre 106 valores, la tendencia estimada es 254,9 + 0,25 t ; los ndices estacionales son E
1
=
35,5; E
2
= 72,8; E
3
= 60,7 y E
4
= 47,6 y el ltimo coeficiente de autocorrelacin significativo es
3
.
El valor ms alejado que se puede prever de la serie es:
317,65 282,15 221,45 194,95 . . . . . . . . .
? 6. Se dispone de los datos cronolgicos: Y
1
= 45,74; Y
2
= 47,95; Y
3
= 49,23; Y
4
= 51,47; ...
Para un valor = 0,8, cul es el cuarto valor de la serie suavizada (S
4
)?
48,89 51,37 41,18 50,95 . . . . . . . . . .
? 7. Un modelo aditivo de perodo 3, ha dado los siguientes ndices estacionales: E
1
= 10; E
2
= 20 y E
3
=
30. Los coeficientes
2
y
3
del modelo en variables categricas se estiman como:
20 y 30 10 y 40 25 y 45 10 y 10 . . . . . . . . . . .
? 8. La modelizacin de una serie aditiva con variables categricas ha dado

Y = 104,8 0,5 t 8,2 Q


2
+ 15,4 Q
3
. El valor previsto para t = 50 es:
71,6 87 95,2 79,8 . . . . . . . . . . .
? 9. En la serie de la pregunta anterior, el ltimo valor observado ha sido y = 81,5 para t = 49. Qu
valor tiene el residuo?
13,2 0 1,2 9,4 . . . . . . . . . . .
? 10 Con 252 datos se han obtenido los coeficientes de autocorrelacin: r
1
= 0,983; r
2
= 0,537;
r
3
= 0,684; r
4
= 0,322; ... En qu intervalo de valores se puede considerar nulo
3
?
0,266 0,236 0,299 0,225 . . . . . . . . . . .
Los autores, 2001; Edicions UPC, 2001.
p148 Series temporales
3.5.99
???Se dispone de 100 valores de una serie siendo los 6 ltimos 53,0; 89,3; 66,6; 29,1; 194,8 y
61,2. Se detecta que tiene una estacionalidad de periodo 5 y que es de tipo multiplicativo.
? 1. El valor de la ltima media mvil es:
74,02 86,56 88,2 87,38 ......................
? 2. Se ha obtenido E
1
= 108,3; E
2
= 75,1; E
4
= 220,6 y E
5
= 65,6. Qu valor tiene E
3
?
25,8 30,4 469,6 220,6 ....
? 3. Por la tendencia se han probado los modelos rectilneo y parablico, obteniendo
Modelo T = a + b t T = a + b t + c t
2
Coeficientes a = 65,24 b = 0,79 a = 65,62 b = 0,68 c= 0,0050
p value 0,0000 0,0221 0,6943
R
2
0,893 0,900
Cul es la previsin para t = 104?
420,07 97,21 126,05 325,16 ...... .
??? Una serie de la que tenemos 92 valores se ha modelizado con variables categricas
obtenindose
2
2 3 4 5

Y 250,83 1,27t 0,006t 5,35Q 8,27Q 10,2Q 15,60Q = + + +


? 4. Cul es la longitud de la estacionalidad (p)?
3 4 5 6 no se sabe ..............................
? 5. Siendo Y
92
= 320, qu valor tiene su residuo?
2,236 13,154 11,224 6,137 ..............................
? 6. Qu valor tiene el ndice estacional E
2
?
no se sabe 0,496 4,854 8,766 ..............................
? 7. En una serie de 100 datos, los coeficientes de autocorrelacin calculados son r
1
= 0,952 r
2
=
0,741 r
3
= 0,583 r
4
= 0,492.
4
ser considerado nulo si r
4
, en valor absoluto, es menor que
0,2792 0,4050 0,4285 0,5412 ..............................
?? Los valores de una serie son 40,22; 54,89; 63,51; ....
? 8. En un suavizado exponencial con = 0,4, cul es el valor de S
3
?
58,338 53,0568 49,0220 52,1252 ..................
? 9. Segn el mtodo de Brown, cul es el valor modelado para t = 3 (
3

Y ) ?
63,790 56,614 51,956 40,220 ..................
? 10. Los valores de una serie son 67,38; 56,09; 75,11; 55,90 y 61,25 y los estimados segn el
modelo resultante del anlisis han sido 56,44; 62,29; 72,13; 59,60; y 65,45.Cul es el valor
del error cuadrtico medio (MSE)?
42,931 40,697 40,374 39,667 ...............................
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p149
23.6.99
????? Los primeros valores de una serie, de la que se dispone de 141 observaciones, son: 225;
219; 196; 197; 235; 208; 191; 212; 216; .... Se trata de un modelo aditivo con estacionalidad de
perodo 4. Por el sistema clsico se ha obtenido como tendencia T
t
= 200 + 0,10 t y como ndices
estacionales E
1
= 0,73; E
2
= 0,87 y E
3
= 0,4.
? 1. Cul es el valor de la primera media mvil?
207,500 208,250 208,375 209,625 210,500 ...............
? 2. Y cul el del residuo para t = 8?
12,20 12,30 12,32 12,40 12,42 ...............
? 3. Cules son los valores de les variables categricas asociadas a t = 10?
(0; 0; 0) (1; 0; 0) (0; 1; 0) (0; 0; 1) (1; 1; 1) ..............
? 4. Si se hubiese modelado con variables categricas, cul habra sido el valor de la
constante
0
?
200,63 200,65 200,73 200,75 200,83 ................
? 5. En una ponderacin exponencial simple ha resultado S
3
= 211,96. Cul es el valor de ?
2,63 3,20 3,30 4,50 5,43 ................
? 6. En la modelizacin de una serie multiplicativa de p = 3, se ha obtenido T
t
= 50 + 0,2 t + 0,1 t
2
; E
1
= 150; E
2
= 50 y para t=3 el residuo ha sido R
3
= 0,8. Cul es el valor de Y
3
?
72,10 61,80 55,75 46,35 52,30 ...............
? 7. Con los 50 valores de una serie se ha obtenido
50
2
i
i 1
(y y) 4
=
=

;
49
i i 1
i 1
(y y) (y y) 3,6
+
=
=

;
48
i i 2
i 1
(y y) (y y) 3,2
+
=
=

y
47
i i 3
i 1
(y y) (y y) 2,8
+
=
=

Qu valor tiene la variancia de r


3
?
0,0600 0,0652 0,0712 0,0754 0,0780 ..............
? 8. Los valores de una serie sin estacionalidad y con tendencia rectilnea son 7,3; 7,8; 8,1; 8,5; 8,8;
9,0; .... Con = 0,4, cul es el valor modelizado para t=3?
7,700 7,380 7,004 7,540 7,860 ...............
Los autores, 2001; Edicions UPC, 2001.
p150 Series temporales
12.1.00
?? Unos datos cronolgicos trimestrales han dado lugar a una tendencia T=120+1,4 t0,2 t
2
y a
una estacionalidad E
1
= 10; E
2
= 8; E
3
= 15 y E
4
= 3.
? 1. Qu diferencia existir entre los valores estimados del primer trimestre del primer ao
y el segundo del ao siguiente?
2 25 13 4 18
? 2. El ltimo dato disponible es el de t = 47. Cul es el valor previsto para t = 50?
310 348 378 318 345
?3. En una serie aditiva de p= 7, los pares de valores (t, Y
t
) son (1; 15), (2; 19), (3; 17),, (6;25), (7;
28), (8; 32), (9; 35), ... La media mvil para t = 4 es igual a 26. Qu vale la de t = 5?
faltan datos 28,86 28,43 29,52
?? Un modelo en variables categricas, con ordenada en el origen igual a 500, ajustado sobre una
serie de perodo p=3, ha evidenciado que la serie crece 0,5 unidades por unidad de tiempo y que
la segunda estacin supera a la primera en 20 unidades, mientras que la tercera est 30 unidades
por debajo de la segunda.
? 4. El valor del coeficiente Q
3
es igual a
30 35 5 10 15
? 5. La previsin para t = 53 es
528 529,5 546,5 548 549,5 .
? 6. En una serie de 100 valores se ha obtenido
100
i
i 1
y 0
=
=

;
i
100
2
i 1
y 125
=
=

y
97
i i 3
i 1
y y 120
+
=
=

.
Qu vale r
3
?
faltan datos 0 0,80 0,96 1 .
? 7. En una serie con 80 datos se ha obtenido r
1
= 0,90; r
2
= 0,80; r
3
= 0,70; r
4
= 0,60. Cul es el
valor absoluto lmite de r
5
para ser considerado distinto de cero?
0,43 0,50 0,53 0,61 0,64 .
? 8. Los valores de una serie son 16,4; 16,9; 18,1; 18,5; 19,3; 19,8; en un suavizado exponencial
con = 0,6. Cul es el error de previsin para t = 4?
0,805 0,925 0,960 1,115 1,300 ....
? 9. En la misma serie del apartado anterior y con igual factor de ponderacin, cul sera el valor
estimado para t = 4 (
4

Y ) utilizando el mtodo de Brown?


17,920 19,076 18,672 19,137
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p151
17.5.00
?? En la descomposicin clsica de una serie aditiva de perodo estacional p = 7, se ha obtenido
como tendencia T=223,82 + 0,63 t. La previsin para t = 102 ha sido 187,25.
? 1. Qu vale la previsin para t = 109?
faltan datos 292,49 191,66 182,66 .....................
? 2. Siendo E
i
la i-sima estacionalidad, y sabiendo que E
6
= E
4
27,16. Cul es la
previsin para t = 104?
faltan datos 262,18 305,18 161,35 195,35 ................
??? Unos datos bimensuales se modelizan como
Y =187,52 + 0,42 t + 10 Q
2
+12 Q
3
+ 16 Q
4
8 Q
5
2 Q
6
? 3.En qu cantidad se diferencian el segundo y el sexto bimestre de un mismo ao? (6

)
12 10,32 18 16,74 ...........................
? 4. Si el ltimo valor disponible es Y
106
= 250,27, qu vale el residuo de este punto?
9,77 30,27 5,73 2,23 ...........................
? 5. Cul es la previsin para t = 107?
232,88 250,69 230,61 224,46 ............................
?? Con 100 datos se ha obtenido
94
i i 6
i 1
(y y ) (y y )
+
=

= 483,22 y
100
2
i
i 1
(y y)
=

= 793,42
? 6. Qu vale r
6
?
hay un error 0,371 0,609 0,684 ............
? 7. Cul es el intervalo de no significacin para r
6
si r
1
= 0,95; r
2
= 0,32; r
3
= 0,84; r
4
= 0,60
y r
5
= 0,90?
0,464 0,179 0,520 1,323 ............
? 8. Se dispone de los valores 23,87; 15,22; 42,75; 54,23 y 50,80. En una ponderacin exponencial
simple con = 0,8, qu vale el error cuadrtico medio?
410,17 350,72 254,34 180,69 ...........................
? 9. En un suavizado exponencial por Brown, con = 0,7, sobre 50 datos, ha resultado Y
50
= 55,87;
S
50
= 49,32;
(2)
50
S = 47,54. Cul es la previsin para t = 52?
70,25 59,41 40,23 36,44 ...........................
? 10. En una serie multiplicativa de perodo p = 3, se ha obtenido
*
1
E = 15,25;
*
2
E = 30,50 y
*
3
E = 45,75. Cul es el valor del primer ndice estacional?
25 50 100 150 200 ............
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p123
2 EVALUACIONES RESUELTAS
Respuesta correcta +1; incorrecta 0,2
l 1. En un anlisis de componentes principales los valores propios, de la matriz de correlacio-
nes, son {2,78; 2; 0,16; 0,05; 0,01} y g
13
= 0,768. Qu vale r
13
?.
0,143 0,527 0,12 0,3072 n ..............................................
Puesto que d
i
= 5 es un valor entero, coincidente con el nmero de valores propios, necesa-
riamente se trabaja con variables estandarizadas y se ha diagonalizado la matriz de correla-
ciones. Entonces,
1 3 1 3 3
r g d 0,768 0,16 0,3072 = = =
L o s a u t o r e s , 2 0 0 1 ; E d i c i o n s U P C , 2 0 0 1 .
p124 Estadstica industrial
17.3.99
En una tabla de correspondencias la 3 columna es 13; 23; 17 y 20, y los totales de les colum-
nas son 100; 97; 73; 133 y 152.
l 1. Cuntos valores propios no triviales hay?
2 3 n 4 5 .........................................................................
Dado que hay p = 4 files y q = 5 columnas, resulta min (p1, q1) = 3.
l 2. Cul es la masa de la 2 columna?
0,314 0,240 0,175 n 0,711 ..............................................
Las masas de las columnas son
p
i j
j i 1
j
p
j
i 1
n
n
f
n
n
=

=
= =

que, para j=2, es


2
2
j
n
97
f 0,175
n 555

= = =

l 3. Cul es el valor del perfil medio de las filas asociado a la 3 columna?


0,714 0,132 n 0,312 0,511 .........................................
El perfil medio de las filas coincide con las masas de las columnas
3
3
n
73
f 0,132
n 555

= = =
l 4. Qu vale la masa total?
1 n 0,13 0,312 0,811 .....................................................
La masa total es, obviamente,
p q
i j
i 1 j 1
n
f f 1
n

= =
= = =

En un anlisis de componentes principales los valores propios de la matriz de correlaciones
son {2,78; 2; 0,16; 0,05; 0,01} y g
13
= 0,768.
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p125
l 5. De qu dimensin es el vector aleatorio?
4 5 n 6 7 .........................................................
La dimensin del vector aleatorio X, coincide con el nmero de valores propios. En este ca-
so p = 5.
l 6. Qu vale r
13
?.
0,143 0,527 0,12 0,3072 n ..............................................
Dado que d
i
= 5, un valor entero coincidente con el nombre de valores propios, necesaria-
mente se trabaja con variables estandardizadas y se ha diagonalizado la matriz de correlacio-
nes. Entonces
1 3 1 3 3
r g d 0,768 0,16 0,3072 = = =
l 7. Cuntos componentes principales se utilizaran?
1 2 n 3 4 ..............................................................
La proporcin acumulada que representan los valores propios (variancias de los componentes
principales) con relacin al total es: 2,78/5 = 0,556 (2,78 + 2)/5 = 0,956 etc. Entonces los
dos primeros ya son suficientes ya que explican el 95,6% del total.
l 8. Al estudiar los componentes principales ha resultado
t
g
1
= {0,48 0,32 0,47 0,48 0,46},
t
g
2
= {0,40 0,21 0,8 0,28 0,26} y Q = diag{4 9 6,25 7,75 8}. Qu vale
p
i
i 1
d
=

?
No se sabe 3,14 4 35 n .............................................
En las se indican Q = diag (s
1
2
s
2
2
. . . s
p
2
) y
p p
2
i i
i 1 i 1
d s
= =
=

resultando
p
i
i 1
d
=

= 35
Los autores, 2001; Edicions UPC, 2001.
p126 Estadstica industrial
19.4.99
En una tabla de correspondencias les 3 y 4 filas son {47; 65; 78; 35} y {82; 42; 76; 23};
Adems, las masas de las filas son {0,134; 0,268; 0,225; 0,223; 0,150}
l 1. Cul es la suma total, n?
225 223 777 1000 n ...............................................
Resulta
3
3
n
225
n 1000
f 0,225

= = =
l 2. Si la masa de la 3 columna es 0,232, qu vale X
33
?
1 0,2141 0,7197 n 0,0682 .............................................
Por definicin
33
3 3
3 3
f 0,078
X 0,7197
f f 0,225 0,232

= = =
Al estudiar los componentes principales ha resultado
t
g
1
= {0,47 0,32 0,48 0,46 0,48},
t
g
2
=
{0,40 0,28 0,8 0,21 0,26} y Q = diag{4 9 6,25 7,75 3,8}
l 3. Si r
12
= 0,632, qu vale d
2
?
22,14 36,48 25,78 9,99 n ..............................................
Las variancias, expuestas en la diagonal de la matriz Q, son razonablemente homogneas,
indicando que se ha diagonalizado la matriz S, y teniendo en cuenta que
12 2
12
1
g d
r
s
= resulta
2
2
12 1
2
2
12
r s 0,632 4
d 9,99
g 0,40

= = =


l 4. Si los dos primeros componentes expliquen un 95% de la variabilidad total, qu vale d
1
+d
2
?
27 32 64 25,65 n ......................................................
Dado que
p p
2
i i
i 1 i 1
d s
= =
=

= 27 y que
1 2
i
i
d d
0,95
d
+
=

resulta
d
1
+d
2
= 0,9527 = 25,65
l 5. Si la primera fila de la matriz R
XY
es (0,942 0,265 0,202 0,011 0,004), qu porcentaje
de la variabilidad de X
1
es explicado por los tres primeros componentes?.
1 0,5236 0,9984 n 0,9763 .......................................
La explicacin es
3
2 2 2 2
i j
j 1
r 0,942 0,265 0,202 0,9984
=
= + + =

L o s a u t o r e s , 2 0 0 1 ; E d i c i o n s U P C , 2 0 0 1 .
Evaluaciones p127
5.11.99
l 1. Habiendo diagonalizado la matriz de variancias-covariancias, qu vale
p
2
i 2
i 1
r
=

?
d
2
1 0,9 Es una funcin cuadrtica de g
i2
n ......
Si se ha diagonalizado la matriz variancias-covariancias
R
XY
= Q
-1/2
G D
1/2
segn aparece en la Pg. 6 de los apuntes, por lo que el producto escalar es
t
R
XY
R
XY
= D
1/2 t
G Q
1
G D
1/2
y siendo Q = diag ( S
1
2
. . . S
p
2
), resulta
2
p p
i 2 2
i 2 2
2
i 1 i 1 i
g
r d
S
= =
=

funcin cuadrtica de g
i2
.
l 2. Si U
23
=33, U
32
=44,
2 3
U 10, U 30 = = , S
2
=5, S
3
=10 y se estandariza, qu vale X
23
?
0,3 n 4,6 6,8 1,4 ....
2 3 3
2 3
3
U U
33 30
X 0,3
S 10


= = =
l 3. Si el mayor valor absoluto de la matriz de correlaciones es 0,307, qu procede?
Calcular los componentes principales Estandarizar Factorizar
Analizar las variables directas n .......................................
Si mx || = 0,307, las correlaciones entre las variables son muy reducidas, la informacin
redundante es prcticamente nula y se requerira un nmero muy elevado de componentes
para explicar razonablemente la variabilidad total. Por todo ello los componentes principales
son intiles.
Si D = diag(3,24 0,7 0,045 0,015) y G = 0,5
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1










l 4. Qu proporcin de X
3
es explicada por Y
2
?
17,5% n 92,3% 1,125% No se sabe ....
Puesto que la suma de los valores d
i
es 4, el orden de la matriz, se ha diagonalizado la matriz
de correlaciones y la proporcin de X
3
explicada por Y
2
es
r
32
2
= g
32
2
d
2
= (0,5)
2
0,7 = 0,175
Los autores, 2001; Edicions UPC, 2001.
p128 Estadstica industrial
l 5. Qu vale la correlacin experimental entre X
3
e Y
1
?
1,2 0,9 n 0,1061 3,4 ......
Teniendo en cuenta que la matriz D, de valores propios, as como la matriz G, de vectores
propios, son de orden 44, se trata de un anlisis de p=4 variables y como la suma de los va-
lores d
i
es cuatro, se ha diagonalizado la matriz de correlaciones y
r
31
= g
31
d
1
= (0,5) 3,24 = 0,9
l 6. El primer componente principal es
un factor de tamao un contraste n una media no se sabe ...........
Un contraste de X
1
y X
2
con X
3
y X
4
ya que los correspondientes coeficientes g
i1
cambian de
signo.
l 7. Cul es la variancia experimental de Y
5
?
No existe n 4 3 0,25 ...
Dado que las matrices D y G son de orden 44, slo hay cuatro variables y, por tanto, el n-
mero de Componentes Principales es, tambin, 4 y no existe Y
5
.
l 8 Cul es la medida relativa de la informacin compartida por dos variables?
La razn de medias la razn de variancias la covariancia la correlacin n
......................................................................................
La correlacin es la medida adimensional relativa de la informacin compartida (covariancia)
por dos variables aleatorias.
l 9 La homogeneidad entre modalidades de un criterio de clasificacin es medida por
los factores comunes el factor especfico
las correspondencias n la covariancia
.................................... .
Las correspondencias, comparando los perfiles mediante la distancia de
2
.
ATENCIN, MARCAR LA NICA RESPUESTA INCORRECTA
l 10 Los componentes principales:
reducen la masa de datos conservan la informacin
eliminan informacin redundante reducen el n de individuos n
reducen el nmero de variables
Reducen el nmero de individuos es incorrecto, ya que disminuyen el nmero de variables.
Los autores, 2001; Edicions UPC, 2001.
Evaluaciones p129
20.3.00
l 1. Una fila de una tabla de correspondencias es {13 26 39 22}, cul es el tercer elemento
de su perfil?
Falta n 0,39 n 39 1 ...............................
El tercer elemento de su perfil es
i3 i3 i3
i i ij
j
f n n 39
0,39
f n n 13 26 39 22

= = = =
+ + +

l 2. Si el perfil de la 3 fila es {0,31 0,60 0,74 0,26} y


3
n

= 500, qu vale el tercer elemento
de esa fila?
Hay un error n 370 0,025 0,01 .........................
Hay un error ya que si fuese un perfil la suma de sus elementos sera 1 y aqu, obviamente, no
se cumple este requisito.
l 3. Si hay 14 puntos fila y 23 puntos columna, cuntos valores propios nulos hay en total?
1 0 10 n 13 .............................
Los valores propios no triviales (distintos de cero) son mn(p1, q1) = 13, por lo que los nulos
son
mx(p; q) mn(p1; q1) = 23 13 = 10.
l 4. Si n
13
= 24, n
1

= 100, n

3
= 90 y n = 900, qu vale el elemento correspondiente de la ma-
triz Z para el estudio de las distancias de
2
entre las columnas?
0,99 0,95 0,05 0,8 n .............
El elemento de la matriz Z ser
13 13 13
1 3 1 3 1 3
f n / n n n 24 900
0,8
f f n / n (n / n) n n 100 90

= = = =

l 5. Si una columna es { 0,15 0,18 0,22 0,45 }, es un perfil o es de frecuencias?


Hay un error Faltan datos Es un perfil n Son frecuencias .......................
Se reconoce que es un perfil si suma 1. Dado que la columna en cuestin cumple dicha condi-
cin se trata, efectivamente, de un perfil.
Los autores, 2001; Edicions UPC, 2001.
p130 Estadstica industrial
l 6. Con Q = diag(2 4 1600 725), D = diag(3,5 0,4 0,07 0,03), si r
12
= 0,87, cul es la parte
de V(X
1
) explicada por el segundo componente?
Falta g
12
0,87 0,4 0,7569 n .......
La matriz Q muestra que las variancias S
i
2
son harto heterogneas, por lo que se ha estandar-
dizado (Opcin B), circunstancia corroborada por el hecho de que traza D = p = 4, y la parte
de V(X
1
) = 1 explicada por el segundo componente principal coincide con la proporcin, es
decir
r
12
2
= 0,87
2
= 0,7569.
l 7. Si Q = diag(16 9 25 4) y cov(X
1
, X
3
) = 18, qu vale
3 1
X X
r ?
Falta n 1,8 0,9 n 0,361 ............
Resulta
X X X X
3 1 1 3
1 3
1 3
cov(X , X ) 18
r r 0,9
S S
16 25
= = = =

l 8. Si los puntos de dos variables se oponen, representa que


se trata de un error son no correlacionadas
su correlacin es alta e inversa n su correlacin es alta y directa
..........................................................
Si los puntos se oponen estn altamente correlacionados de forma inversa.
l 9. U
32
= 24, U
23
= 32, U=
t
(9 12 16 8 14) y Q = diag(12 14 16 8 13), qu vale X
32
?
4 6 12 n 16 ......................
Teniendo en cuenta que, como muestra la matriz Q, las variancias son del mismo orden de
magnitud, slo se requiere centrar y
X
32
= U
32

2
U = 24 12 = 12
l 10. Si r
31
= 1, qu vale r
32
?
No se sabe 0 n 1 1 ......................................
Dado que siempre
p
2
i j
j 1
r 1
=
=

, si r
31
= 1, necesariamente todos los dems r
3j
, j > 1, han de ser
nulos.
Los autores, 2001; Edicions UPC, 2001.

Potrebbero piacerti anche