Escalamiento de Datos

1.
Escalamiento de los datos: Existen diversas tcnicas para el escalamiento de los

datos, tales como la estandarizacin (la mayora de valores escalados se encuentran
entre 3 y 3), escalamiento entre 1 y 1, escalamiento entre 0 y 1, entre otros. La
idea de estas tcnicas es llevar a todas las entradas de la RNA a rdenes de magnitud
similares, para evitar que exista una predisposicin numrica a ponderar de mayor
forma aquellas variables con valores numricos ms grandes. Una de las tcnicas ms
utilizadas consiste en transformar los datos de la(s) serie(s) a valores comprendidos
entre 0 y 1, mediante:
2. Patrones de Entrenamiento y Prueba: Los valores de la(s) serie(s) de tiempo se

dividen en dos conjuntos de datos: a) Patrones de entrenamiento: conjunto formado
por el 80 % de los datos de la(s) serie(s), que se seleccionan en forma consecutiva y
ordenada. Este conjunto de datos se utilizar para el entrenamiento de la red neuronal.
b) Patrones de prueba: conjunto formado por el 20% de los datos de la(s) serie(s),
correspondiente a los datos restantes, una vez que se han seleccionado los patrones
de entrenamiento. Este conjunto de datos se utiliza para evaluar la capacidad de
generalizacin o prediccin de la red.
3. Topologa de la RNA: Direccin de la informacin: Alimentacin adelantada. Tipo de
interconexin: Totalmente conectada. N de entradas: p + 1 (una constante de valor 1,
denominada sesgo o intercepto). N de capas ocultas: 1. N de nodos en la capa
oculta: q. N de salidas: 1. Funcin de activacin de los nodos de la capa oculta:
logstica. Funcin de activacin de la salida: logstica.
En el caso de las redes neo-difusas se usa una sola neurona y el nico parmetro
ajustable es el nmero de segmentos.
4. Determinacin de las p entradas a la red neuronal artificial:
Caso Univariable:
- La periodicidad de los datos: se consideran 12 o 13 retrasos debido a que las series
son mensuales. Pudiera ser conveniente construir una primera red con 13 entradas,
correspondientes a los 13 retrasos y analizar los pesos, de manera que se seleccionen
las entradas asociadas a los pesos de mayor magnitud, como lo sugieren Faraway y
Chatfield [5]. Este anlisis de los pesos ayuda a identificar las variables de entrada
ms importantes.
- Una vez determinado el modelo ARIMA, seleccionar como entradas los valores
correspondientes a los retrasos de yi involucrados en este modelo. Esto se realiza con
la intencin de verificar hasta que punto un conocimiento estadstico a priori, puede
ayudar en el diseo de una RNA para prediccin de series de tiempo.
- Otra alternativa es la de considerar los correlogramas simple y parcial de la serie

estacionaria. Las entradas a la red seran los datos correspondientes a los retrasos que
resultaran con una correlacin significativamente diferente de cero.
- Mediante pruebas por ensayo y error: considerando, por ejemplo, los datos
retrasados 1,4,8,12 periodos, 1,3,6,9,12 periodos, o 1,2,3,4 periodos.
Caso Bivariable:
Se deben considerar retrasos de la serie a predecir (y), as como tambin valores
presentes y pasados de la serie relacionada (x). Para definir las entradas pueden
considerarse los siguientes aspectos:
- Periodicidad de los datos. Para datos mensuales se consideran 12 o 13 retrasos por
serie.
- Los retrasos de inters para las series de entrada y salida pueden identificarse, como
en el caso univariable, mediante el modelo ARIMA o mediante los correlogramas simple
y parcial (se seleccionan los retrasos cuyas correlaciones sean significativamente
diferentes de cero).
- Modelo de Funcin de Transferencia: se considera como entrada los valores de la
serie de entrada (x) correspondientes a los b retrasos, indicados en el MFT. Tambin
los valores de la serie de salida (y) correspondientes a los r retrasos.
- Correlacin Cruzada: se consideran como entradas los valores correspondientes a los
retrasos de la serie x que tengan CC significativamente diferentes de cero.
- Mediante pruebas por ensayo y error, considerando diferentes retrasos para ambas
series.
5. Determinacin del nmero de nodos de la capa oculta (q). Una regla ad hoc, que en
experimentos previos ha resultado de utilidad, asume que el valor inicial del nmero de
nodos de la capa oculta sea igual al promedio entre el nmero de entradas y salidas.
Se puede complementar la regla mediante pruebas por ensayo y error, agregando ms
nodos, y comparando los errores de ajuste y prediccin. Esto no aplica en el caso de
las neuronas neo-difusas ya que estn formadas por una sola neurona.
6. Algoritmo de Entrenamiento: Retropropagacin [9, 10, 11]. El algoritmo de
entrenamiento para las neuronas neo-difusas es el algoritmo de actualizacin
incremental [18].
7. Seleccin de los pesos iniciales. Es recomendable probar con diferentes conjuntos de
valores iniciales para tratar de obtener buenos resultados. Los pesos iniciales se
generan aleatoriamente en cincuenta oportunidades [5]. Se selecciona el modelo que
obtenga el menor promedio entre la suma de cuadrados de los errores de ajuste y

prediccin.
8. Entrenamiento de la RNA seleccionada. Se establece el nmero mximo de ciclos, el
error permitido de convergencia, tasa de aprendizaje, el incremento de las tasas de
aprendizaje y momento se fija por ensayo y error. Una vez definido el modelo, se
generan los valores de la serie de tiempo ajustada o producida por la red, utilizando los
patrones de entrenamiento. Finalmente, se calcula el error de entrenamiento.
9. Prediccin. Usando el mejor modelo previamente entrenado, se obtiene el valor de
prediccin yt+1. Para hacer predicciones ms all de este perodo, se utiliza yt+1 como
entrada para producir la prediccin yt+2 y as sucesivamente para todo el conjunto de
prediccin. Al finalizar se calcula el error de prediccin, como medida de generalizacin
del modelo.
10. Comparacin entre modelos con diferentes entradas. Usando el error de
entrenamiento y de generalizacin de cada modelo se hace la comparacin y se
selecciona el modelo de red cuyos valores sean mnimos. La correlacin entre los
valores originales de la serie y los estimados puede usarse como una medida de la
exactitud de la prediccin. De este modo se selecciona el modelo cuyos errores de
entrenamiento y prediccin sean menores.
A continuacin se muestra un ejemplo de una RNA para prediccin (caso univariable)
con una capa oculta,Figura 5.
5. Experimentos y Resultados
Se estudiarn dos aplicaciones, una correspondiente al caso univariable y la otra al
bivariable. Para el anlisis de los resultados obtenidos en los diferentes mtodos se
consideran los siguientes criterios comparativos:
a) Criterios comparativos para el ajuste [5]:

- Desviacin Estndar Residual (DER): Es un criterio de seleccin de modelo y un valor
pequeo indica una mayor adecuacin del modelo. Su expresin es:
donde S es la suma cuadrtica de los residuos, T es el nmero de las observaciones

efectivas que se usan en el ajuste y r es el nmero de parmetros estimados en el
modelo, incluyendo la constante.
- Criterio de Informacin de Akaike:
AIC = T ln(S/T) + 2r
(13)
Este criterio permite seleccionar un modelo. Se prefiere el modelo que tenga el menor
valor de AIC.
- Criterio Bayesiano de Schwarz (SBC):
SBC = T ln(S/T) + r ln(T)
(14)
Este criterio es un mtodo para la seleccin de un modelo. Se prefiere el modelo que

tenga el mnimo valor del estadstico. El SBC penaliza los parmetros adicionales ms
severamente que el AIC, conduciendo a modelos ms simples.
b) Criterios comparativos para la prediccin:
- Error Medio Absoluto (EMA).
donde yt+i son los valores observados de la serie que pertenecen al conjunto de
prediccin y, son los valores pronosticados por el modelo ARIMA [8].
- Raz del Error Cuadrado Medio Porcentual (RECMP) [8]:
Correlacin (R) entre los valores observados y los pronosticados por el modelo. Valores
altos de esta correlacin indican una buena adecuacin del modelo.
5.1. Caso Univariable: Serie Nacimientos

En el caso de predicciones con una sola serie de tiempo se analizar la serie de tiempo
del nmero de nacimientos mensuales, ocurridos en Espaa desde enero de 1960
hasta diciembre de 1999, lo que equivale a 40 aos [12]. Estos datos se dividen en
dos conjuntos: datos para el ajuste o entrenamiento: enero 1960 - diciembre 1991,
comprende 384 meses (32 aos) que equivale al 80% de los datos y datos para la
prediccin o prueba: enero 1992 diciembre 1999, comprende 96 meses (8 aos) que
equivale al 20% de los datos. La serie completa se presenta grficamente a
continuacin: Figura 6.
El anlisis se har aplicando las metodologas ARIMA y RNA. Al aplicar la metodologa

ARIMA (seccin 2.1), utilizando el paquete SPSS [13, 14], se obtienen los
correlogramas: Figura 7 y 8.
En la parte regular se observa un patrn MA (Promedio Mvil) de orden 1 (q=1). En la

parte estacional se observa patrn autoregresivo y de promedio mvil. Sin embargo, el
modelo de mejor adecuacin y prediccin result ser el ARIMA(0,1,1)*(0,1,1)12 cuyol
modelo estimado es [15]:
(1-B12)(1-B) yt* = (1-0,712 B

Escalamiento de Datos

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Escalamiento de Datos

Caricato da

Copyright:

Formati disponibili

1.

Escalamiento de los datos: Existen diversas tcnicas para el escalamiento de los

2. Patrones de Entrenamiento y Prueba: Los valores de la(s) serie(s) de tiempo se

- Otra alternativa es la de considerar los correlogramas simple y parcial de la serie

obtenga el menor promedio entre la suma de cuadrados de los errores de ajuste y

a) Criterios comparativos para el ajuste [5]:

donde S es la suma cuadrtica de los residuos, T es el nmero de las observaciones

SBC = T ln(S/T) + r ln(T)

Este criterio es un mtodo para la seleccin de un modelo. Se prefiere el modelo que

5.1. Caso Univariable: Serie Nacimientos

El anlisis se har aplicando las metodologas ARIMA y RNA. Al aplicar la metodologa

En la parte regular se observa un patrn MA (Promedio Mvil) de orden 1 (q=1). En la

(1-B12)(1-B) yt* = (1-0,712 B

Potrebbero piacerti anche