Sei sulla pagina 1di 66

Minera de datos para supervisin.

Aplicacin a sistemas elctricos.


Ral Vilcahuamn S. Y Joaquim Melndez

Grup EXIT (AEDS)
Institut d Informtica i Aplicacions
Universitat de Girona

FIEE
Universidad Nacional del Centro del Per


Contacto:
R_vilcahuaman@iansa.com.pe
Minera de datos para supervisin.


Minera de Datos?
Tcnicas y mtodos para la Explotacin Eficiente de la
informacin contenida en los datos.

Supervisin?
Monitorizar, detectar y diagnosticar fallos de un proceso o
sistema para proponer acciones correctoras
Qu Proceso?
Sistemas elcticos de potncia

Qu Datos?
Eventos
Perturbaciones
Incidencias
Consumos

Qu objetivo?
Monitorizar la calidad de onda
Localizar fallos en la red
Pronosticar consumos
...
Dranetz PX5
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Ej: Distribucin elctrica
16.560 km (400 kV)
16.242 km (220 kV)
20.914 km (100 y 132 kV)
53.716 km Total

Proceso:
Operacin automtica
Agentes externos
(vegetacin, clima, consumo, etc)
Distribuida en el territorio:
(Espaa 2003, Distr+Transp)



Objetivos:
Monitorzar calidad de onda.
Diagnstico perturbaciones.
Localizar origen de las faltas


Datos:
PQM en subestaciones: registros de perturbaciones
Centro de control: registros Incidencias
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Contenido de la Presentacin
Sistemas de Supervisin
Tareas.
Redundancia: mtodos de deteccin y diagnstico de fallos
Pros y Contras.

Minera de datos:
Deteccin y Diagnstico de fallos a partir de histricos:
Modelos de datos.
Organizacin de los datos.
Pretratamiento y transformacin
Anlisis Exploratorio
Reduccin de dimensionalidad.
Tcnicas y Mtodos.
Evaluacin del modelo.
Explotacin

Aplicaciones y ejemplos

Conclusiones

Sistemas de Supervisin
Tareas.
Redundancia: mtodos de deteccin y diagnstico de fallos
Pros y Contras.
Integracin.
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Sistemas de Supervisin
Tareas
Detectar fallos:
Discriminar entre funcionamiento correcto y anmalo.
(ms all de generacin de alarmas por simple sobrepasamiento de umbral)

Diagnosticar fallos:
Caracterizar los fallos.
Localizar su origen.
Descubrir sus causas.

Evaluacin de situaciones:
Pronosticar la evolucin del sistema
Analizar riesgos y consecuencias.
Proponer acciones correctoras


Principio bsico de la supervisin: Redundancia.
Ejemplo: Redundancia fsica:
2 sensores: T1(t) y T2(t) : T1(t)T2(t) Fallo Detectado
3 sensores: T1(t) , T2(t) y T3(t) : T1(t)=T3(t)T2(t) Fallo Diagnosticado:T2(t)
Continuamos midiendo con T1 y T3
DETECCIN DE FALLOS
PROCESO control
DIAGNOSIS
(deduccin de origen o causa)
RECONFIGURACIN
(Propuesta de acciones )
Redundancia
Conocimiento
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Sistemas de Supervisin
Redundancia: Como puede obtenerse?

1. Modelos Analticos: a partir del modelo de la planta (o parte).
El modelo (ecuaciones) impone restricciones que deben cumplir las
variables involucradas.
Obtencin y calidad del modelo
Mltiples estrategias: estimacin de parmetros, observadores, ecuaciones de
paridad (ARR), etc.
Ejemplo: Balances de energa, flujos de potncia.

2. Experiencia: Tcnicas IA.
El conocimiento acumulado permite discernir comportamientos anmalos
por simple observacin.
Representacin del conocimiento: sistemas expertos (reglas),
Razonamiento (inferencia): lgica, etc.

3. Histricos:
Los datos registrados contienen comportamientos pasados que deben
concordar con los presentes, ya sea en comportamiento normal o en fallo.
Aprendizaje
Reconocimiento en lnea.

R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Sistemas de Supervisin.
Pros i Contras

Redundancia Analtica:
Fundamento terico:
Consistencia con los principios
fsicos (modelo)
Repetibilidad en procesos
similares.
Mantenible y adaptable:
parametrizacin.

Basada en el conocimiento
Retencin de conocimiento
experto.
Replicable, mantenible y
adaptable.
Explicativo, por traza de las
reglas ejecutadas.

Basada en histricos
Explotacin de datos histricos
Explicativo por semejanza.
Capacidad de aprendizaje.
Redundancia Analtica:
Disponibilidad de modelos
Calidad del modelo: parmetros, no
linealidades, punto de trabajo, etc.
Necesidad de clculo
Fuerte componente terica



Basada en el conocimiento
Obtencin de la base de
conocimiento (reglas)
Disponibilidad de los datos en lnea
(caducidad)
Estrategia de inferencia.

Basada en histricos
Representatividad del modelo ?
No reutilizable: cada proceso tiene su
historia.


Minera de datos



Modelos de datos.
Organizacin de los datos.
Pretratamiento y transformacin
Anlisis Exploratorio
Reduccin de dimensionalidad.
Tcnicas y Mtodos.
Evaluacin del modelo.
Explotacin
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Minera de datos
Objetivo:
Modelar comportamientos descritos por los datos
Prediccin por reconocimiento de patrones.

Procedimiento:
Exploracin de los datos y anlisis
Construccin (y validacin de modelo/s)
Explotacin del modelo: describir, reconocer, predecir
comportamientos.

Bsqueda de patrones y/o relaciones entre variables dentro del
conjunto de datos
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Minera de Datos
Tipos de modelos
Segn el objetivo:

Modelos Predictivos: Pretenden estimar valores futuros o
desconocidos de variables de inters a partir del conocimiento de
otras variables.
Herramientas: Clasificadores, Regresores.

Modelos Descriptivos: Identifican patrones que explican los datos.
Sirven para explorar las propiedades de los datos observados.
Herraimientas: Clustering (agrupacin), Reglas de asociacin, Anlisis de
correlaciones.

Segn tcnica empleada:

Modelos Estadsticos:
Modelos computacionales: rboles, redes neuronales, Clasificadores,
etc.

R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Minera de datos
Descubrir conocimiento
La minera de datos es un proceso que lleva a descubrir comportamientos
descritos por los datos y por tanto al conocimiento implcito en ellos
(knowledge discovery) a travs de la manipulacin de estos.
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Minera de Datos.
Tareas
1. Exploracin de los datos:

Pretratamiento y preparacin de los datos: filtrado, eliminacin
de datos corruptos e incompletos, identificacin de outliers, seleccin
de subconjuntos, extraccin de caractersticas, transformaciones.
Anlisis exploratorio: identificacin de variables relevantes,
identificar posibles estructuras del modelo y evaluar su complejidad.

2. Construccin y validacin del modelo: Consiste en considerar
varios modelos y evaluar las prestaciones de cada uno de ellos para
determinar el mejor

3. Explotacin: Utilizacin del modelo seleccionado para generar
predicciones o estimaciones a partir de los datos disponibles.

Supervisin: Deteccin y Diagnstico de fallos
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Minera de Datos
Organizacin de los datos
Data warehouse (Def.): Base de datos que contiene un conjunto integrado de
datos (centralizacin de mltiples fuentes), no voltil en el tiempo (no cambia
pero puede incrementar) y que es til para la toma de decisiones.

Supervisin de procesos:
Datos: proceso (SCADA), mantenimiento, control de calidad, etc.
Histricos: incrementan pero no se modifican.
Utilidad: ajuste parmetros, mantenimiento, rediseo, etc.

Tipos de datos:
Cualitativos: Ordenados / NO ordenados (simblicos, nominales)
Cuantitativos: continuos /discretos.

Matrices: Es la estructura bsica para iniciar el anlisis. Se construye a partir de
consultas a la base de datos:
Filas: Individuos (situaciones)
Columnas: atributos o variables.

Elemento (i,j) : clasificacin del individuo (situacin) i
de acuerdo con el atributo j.
Abstraccin
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Minera de Datos
Pretratamiento de los datos
Calidad:
Datos perdidos o inexistentes:
Eliminar los individuos con atributos/variables faltantes
Substituir los faltantes por otros.
Datos anmalos : Conviene identificarlos, analizar su origen y su tratamiento
depender de los objetivos:
Datos Corruptos: medidas errneas Eliminar
Especiales: reflejan situaciones especiales:
Si interfieren en la creacin del modelo Eliminar (Ej. Modelo en comport. normal)
Si son el objetivo buscado Conservar. (Ej. Situacin a diagnosticar).
Transformacin:
Variables cuantitativas: Si cada las variables representan magnitudes diversas (dif.
unidades) es conveniente uniformar las escalas a travs de transf. lineales:
Normalizacin: min=0, max=1
Estandarizacin: m=0 y o=1 / Ayuda a identifcar outliers

Variables cualitativas : Son tiles en las clasficaciones pero puede ser
conveniente asignar alguna mtrica.
Binarizacin: Supone convertir cada variable en tantas como posibles valores puede
tomar y asignar 1 o 0 a las correspondientes.
Ej: T,P son cuantitativas y A es cualitativa: alarma definida en: {baja, media, alta}
T P A T P Ab Am Aa
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Minera de Datos
Anlisis Exploratorio (I)
Anlisis estadstico de los datos:
Univariante: cada variable por separado
Multivariante: relaciones entre variables.

Anlisis exploratorio univariante:
Representaciones grficas: Grficos de barras, Histogramas, Distribucin de
frecuencias, Grficos de porciones, etc.
Medidas estadsticas: (Sobre el conjunto de los datos o su distribucin de
frecuencias)
Localizacin: media, media ponderada (en funcin de su distribucin), mediana, etc.
Variabilidad: Desviacin, rango, Anlisis por Cuartiles, Coeficiente de Variabilidad
(o/|m|), etc.
Heterogeneidad: Entropa, ndice de Gini, etc.
Concentracin:
(A)simetra: Comparar media y mediana, Boxplot,etc.
Kurtosis: ndice de normalidad (distribucin) de los datos.

Control estadstico de procesos (SPC): Anlisis de localizacin y variabilidad en lnea
sobre una ventana temporal de datos en condiciones estacionarias del proceso.

Off line / on line
Histrico Ventanta

R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Minera de Datos
Anlisis Exploratorio (II)
Anlisis exploratorio bivariante:
Representacin grfica:
Scatterplot: mltiples variables
analizadas dos a dos




Medidas estadsticas:
Concordancia: Se observa relacin o tendencia entre valores
altos (bajos) de dos variables.
Discordancia: Se observa relacin o tendencia entre valores altos
(bajos) de una variable y los bajos (altos) de la otra.
Medibles con: Covarianza (oxoy, -oxoy), Coeficiente de
correlacin (0,1).


20 40 60 80
0
200
400
600
800
0 200 400 600 800
10
20
30
40
50
60
70
80
90
MT
AT
-10 -5 0 5 10 -5 0 5 -10 -5 0 5 10
-10
-5
0
5
10
-6
-4
-2
0
2
4
-10
-5
0
5
10
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Minera de Datos
Reduccin de dimensionalidad: PCA
Principal Component Analysis (PCA)
La informacin de los datos reside en su
variabilidad.
Objetivo: Capturar la misma varianza en un
conjunto menor de variables obtenido por
combinacin lineal de las originales.

Nuevo espacio:
Variables latentes
Direcciones de mxima varianza
Menor dimensin
Varianza ~



P

e
e
X
1
X
2
X

e
e
X
1
X
2
X

Cuando el nmero de variables a tratar es elevado (m) y


stas estn relacionadas es posible reducir su complejidad
trabajando en un espacio de menor dimensin:


(
(
(
(
(
(
(
(

=
nm n n
m
m
x x x
x x x
x x x
X
. . .
. . .
. . . . . .
. . .
. . .
. . .
2 1
2 22 21
1 12 11
m variables
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Modelo datos PCA:


Datos proceso:






T T
V V X X
n
S A =

=
1
1
(
(
(
(
(
(
(
(

=
nm n n
m
m
x x x
x x x
x x x
X
. . .
. . .
. . . . . .
. . .
. . .
. . .
2 1
2 22 21
1 12 11
E X E p t X
N
a
T
a a
+ = + =

1
0
2 1
> > > >
m

Matriz de covarianzas
diagonalizada:
Valores propios de S
ordenados de mayor a
menor indican la
varianza en cada nueva
direccin
Las columnas de V contienen las cargas o loadings (pa) para cada
variable latente o score (ta) :


La varianza asociada a cada ta viene dada por a.
a a
Xp t =
ta: scores
Pa: loadings
E: Matriz Error

Obj a pequeo!
PCA. El modelo.
P

e
e
X
1
X
2
X

e
e
X
1
X
2
X

m variables
n

o
b
s
e
r
v
a
c
i
o
n
e
s

R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
PCA.
Explotacin del modelo en supervisin
La proyeccin de datos sobre el modelo permite extraer conclusiones.
Parmetros estadsticos:
tiles en el anlisis y por tanto para la deteccin y diagnstico:

Q-statistic o SPE: Error de prediccin.
Mide el error introducido en la proyeccin de los datos analizados.
Permite identificar datos con estructura diferente a la del modelo.
Se mide en la direccin del error
Hotellings T2:
Bondad de los datos
respecto al modelo de
referencia.
Permite identificar datos con
la misa estructura que los
del modelo pero operando
en un rango diferente.
Medido en la direccin del
modelo.
P

e
e
X
1
X
2
X

e
e
X
1
X
2
X

R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP


Minera de Datos
Mtodos y modelos estadsticos
Modelos estadsticos (probabilsticos): Asumen que los datos responden a
un modelo probabilstico.

Mtodos paramtricos: Asumen que los datos se corresponden con una
funcin predefinida y especificada por un conjunto de parmetros.
Funciones de distribucin: Ej. Distribucin Gaussiana, Chi-cuadrado, t-Student.
Anlisis Discriminante (Clasificacin supervisada): Ej. Fn. discriminante de Fisher.
Modelos de Regresin: Ej.

Mtodos no paramtricos: Los datos corresponden a una funcin de
distribucin pero la forma de esta no est prefijada ni parametrizada. Ej.
Histogramas, uso de funciones Kernel


Inferencia estadstica: Mtodos inductivos que tratan de obtener
afirmaciones a partir del conjunto de observacin:
Estimadores: media, varianza, mtodo de mxima similitud metodos
bayesianos, etc.
Test de hiptesis
in n i i i
x b x b x b a y + + + + = ...
2 2 1 1
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Minera de Datos
Mtodos y modelos computacionales
Modelos computacionales :
Desarrollados con propsitos informticos o de Inteligencia Artificial.
Muchos de ellos tienen fundamento estadstico y otros no asumen tales modelos.

Mtodos:
Clustering o Agrupacin: Descubrir agrupaciones de observaciones en clases
homogneas.
Para ello se definen ndices de proximidad o seimilitud y nmero de agrupaciones.
Ej: Centroide (Alg. LAMBDA), Dendrogramas, etc.
rboles de decisin: Se usan bsicamente como clasificadores (clases disjuntas) y
se construyen a partir de criterios de particin. Ej. Id3, C4.5
Redes neuronales: Propsitos varios
Perceptrn, para clasificacin (supervisado).
Mapas autoroganizativos: para clustering (no supervisado)
Mquinas de Soporte Vectorial (o Vectores Soporte): Clasificadores lineales
en espacios de muy alta dimensionalidad inducidos por funciones Kernel (o ncleo).
Mtodos basados en casos y vecindad: Modelo a partir de experiencias o casos
previos. Razonamiento a partir de casos similares (vecinos prximos).

Modelos de Regresin /Anlisis Discriminante:Idem

R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Ejemplo: Agrupacin
Perturbaciones en sistema
elctrico: Huecos de tensin

Extraccin de caractersticas:
Duracin
Profundidad
Tiempos de cada y recuperacin
Desfases

Objetivo:
Encontrar familias de huecos

Herramienta: Dendrograma
Num agrupaciones depende de la
distancia de corte
1232526272829202122232467464789444542431011121314151617181930 31323334353637383950514849454041
0
50
100
150
200
250
300
350
0 5 10 15
-1
-0.5
0
0.5
1
cycles
V
o
l
t
a
g
e

i
n

p
u

0 5 10 15
0
0.2
0.4
0.6
0.8
1
1.2
cycles
V
o
l
t
a
g
e

i
n

p
u

Individuos: huecos
d
i
s
t
a
n
c
i
a

R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
H%-Duration(ms) in 'SALT (TR1)'
20 40 60 80
0
200
400
600
800
0 200 400 600 800
20
40
60
80
MT
AT
Ejemplo: Agrupacin (I)
Perturbaciones en sistema
elctrico: Huecos de tensin

Registros de eventos y formas de onda en
una subestacin de distribucin.

Caractersticas evento:
Duracin
Profundidad (H%)

Objetivo: Obtener un modelo de
comportamiento en base al origen de la
perturbacin MT/AT

Herramienta: Mapas autoorganizativos
Construccin: Aprendizaje a partir de
registros.
Localizacin nuevo evento: Por similitud a
un nodo del modelo

0 100 200 300 400 500 600 700 800 900 1000
10
20
30
40
50
60
70
80
90
Duration-H%: o->BMU, *->MT, +->AT
AT
AT
AT(12)
MT(1)
AT
AT(1)
AT
MT(1)
MT
MT
MT(3)
MT
MT(6)
AT(1)
AT
AT
AT
AT
AT(1)
AT
MT
MT
MT(4)
AT
AT(26)
MT(1)
AT
AT
AT(9)
AT
AT(2)
AT
MT
AT(2)
MT(1)
MT
MT(2)
AT
AT(2)
ATAT
AT(3)
AT
AT
AT(1)
MT
MT(1)
MT
MT(3)
AT
AT(1)
AT
AT(1)
AT
AT(1)
AT
MT(1)
AT(1)
MT
MT
MT(1)
MT
MT(1)
AT
AT(1)
AT
AT(1)
AT
AT(1)
MT
MT(4)
MT
AT(1)
MT
MT(1)
MT
MT(2)
AT
AT(1)
MT
MT(1) MT
MT(1)
MT
MT(2)
MT
AT(1)
MT
MT
MT(1)
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Ejemplo: rboles decisin
Perturbaciones en sistema
elctrico: Huecos de tensin

Extraccin de nuevas caractersticas:
Duracin
Profundidad
PN factor
Tensin caracterstica

Objetivo: Asignar un origen en funcin
de las caractersticas

Herramienta: rbol de decisin
Construccin: a partir de ejemplos
previos
Diagnstico: Recorriendo el rbol hasta
las hojas.

R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Minera de Datos
Evaluacin de mtodos y/o modelos
Los mtodos usados en minera de datos pueden ser diversos y por tanto
tambien las representaciones de los modelos obtenidos.
Los siguientes criterios se utilizan en la validacin de los modelos
diferentes modelos:
Tests Estadsticos: cuando el modelo obedece a funciones de densidad de
probabilidad, se establecen medidas de:
Distancia entre modelos (chi cuadrado, distancia entropica, etc.)
Discrepancia, respecto un objetivo (Ej. Basdo en dist. Euclidea, discrepacia de
Kullback-Leibler)
Criterios Bayesianos
Criterios computacionales:
Usan los datos disponibles en la comparacin/validacin de modelos agrupandolos
de formas diversas.
Algunos criterios: Validacin cruzada, Bagging, Algoritmos genticos.
Criterios basados en funciones de prdida:
Tpicamente usado en problemas de clasificacin o prediccin. Se trata de comparar
los xitos y fracasos en la prediccin/clasificacin.
Algunas formas: matriz de confusin, curva ROC, etc.
Ejemplo diagnstico: Num falsas alarmas / faltas no detectados
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Minera de Datos
Explotacin en supervisin
Modelo: creado a partir de histricos

Deteccin de fallos:
El modelo representa el comportamiento normal del sistema.
La deteccin se produce cuando los datos actuales no corresponden al
modelo.
Ej. Control Estadstico

Diagnstico de fallos
El modelo/s contemplar las situaciones de fallo e incluir informacin de
diagnstico (localizacin, causas, etc.)
Diagnstico corresponde a la identificacin de los datos actuales con un
modelo de fallo.
Ejemplo: Razonamiento Basado en Casos.

Pronstico / Prediccin de fallos
El modelo se construye para situaciones de fallo con informacin previa a
su aparicin.
El reconocimiento de esta informacin permite el pronstico.


Minera de datos
para supervisar redes de
distribucin elctrica


Objetivos
Caracterizacin de los datos
Determinacin del origen de las perturbaciones
PCA
rboles de decisin
Diagnstico de perturbaciones
Razonamiento Basado en Casos
Pronstico consumo elctrico
Mtodo hbrido:
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Distribucin elctrica
16.560 km (400 kV)
16.242 km (220 kV)
20.914 km (100 y 132 kV)
53.716 km Total

Operacin automtica
Agentes externos
(vegetacin, clima, consumo, etc)
Distribuida en el territorio:
(Espaa 2003, Distr+Transp)



Objetivo:
Diagnstico perturbaciones
registradas en una subestacin.
(Catalua)
Localizacin de faltas.

Registros Calidad de onda:
PQM en subestaciones: registros de perturbaciones en un ao
Centro de control: registros Incidencias en un ao

Colaboracin eXiT y ENDESA DISTRIBUCIN
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Objetivos
Diagnstico automtico de perturbaciones registradas en
subestaciones de distribucin elctrica:

Caracterizacin de perturbaciones: Huecos de tensin.
Clasificacin de perturbaciones de acuerdo con su origen.
Localizacin del origen de la perturbacin (MV/HV)
Asociacin entre perturbaciones e incidencias registradas en el
centro de control.
Diagnstico por semejanza con perturbaciones previas.




R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Caracterizacin Perturbaciones


0.9
1.0
Va
Vrms [p.u.]
%H3
Vb
Vc
TS3

Time
0.9
Vrms [p.u.]
t
AV/AtC

AV/AtR
TS
1.0
CAIDA SISTEMA EN
FALLA
RECUPE
RACIN
%H
TUF

Type A: equal voltage drop in three phases
Type Ca: voltage drop between phases b and c
Type Da: voltage drop in phase a

Type A
Type Ca
Type Da
Type Cb Type Cc
Type Db Type Dc
k=0
k=1 k=5
k=3
k=4 k=2
0 5 10 15
-1
-0.5
0
0.5
1
cycles
V
o
l
t
a
g
e

i
n

p
u

0 5 10 15
0
0.2
0.4
0.6
0.8
1
1.2
cycles
V
o
l
t
a
g
e

i
n

p
u

Atributos temporales
Clasificacin fasorial
Formas de Onda
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
(M)PCA para monitorizar
la calidad de onda
Monitorizacin Calidad Onda
Deteccin de variaciones en los
parmetros de la forma de onda elctrica
(perturbaciones):
Huecos de tensin (sags)

Objetivo
Localizar el origen (HV /MV) de las
perturbaciones registradas en
subestaciones.

Datos:
Forma de onda de huecos de
tensin:
1 segundo de duracin
6 variables (j)
3 Tensiones de fase (rms)
3 Corrientes (rms)
2240 muestras cada variable (k)
Power Quality Monitor
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
PCA para PQM
Observaciones
Pretratamiento
Alineamiento:
Todos los registros empiezan 2 ciclos antes del inicio del hueco (critical
point).
Extraccin de caractersticas:
Clculo de rms en ventana mvil de un periodo a partir de la componente
de frecuncia fundamental (extraida por FFT).

Matriz de observacin






Conjunto de entrenamiento: Origen del hueco conocido HV(AT)/MV(MT)
X
Variables (J)
Tiempo (K)
H
u
e
c
o
s

(
I
)

0 5 10 15
-1
-0.5
0
0.5
1
cycles
V
o
l
t
a
g
e

i
n

p
u

0 5 10 15
0
0.2
0.4
0.6
0.8
1
1.2
cycles
V
o
l
t
a
g
e

i
n

p
u

Hueco de tensin
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
PCA para PQM
Observaciones
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
PCA for PQM
Observaciones-Descartes
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
PCA para PQM
Unfolding
Variables x tiempo=6x2240=13340
1 K 2K jK JK
Sag


T (K)

T (k)

T (2)
T (1)
X
J=1 J=2
X
Variables (J=6)
Time (K=2240)
S
a
g
s

(
I
)

Convertimos la matriz
tridimensional (IxJxK)
en una matriz
bidimensional (I x KJ)
X=
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
PCA para PQM
Metodologa PCA

Histricos: Origen conocido
Construimos un modelo PCA para la clase HV(AT).

Nuevos datos: Cual es su origen?
Se proyectan sobre este modelo.
Se evalua su adecuacin al modelo de acuerdo con los
ndices T
2
y Q
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
PCA para PQM
Modelo PCA
El modelo PCA con 10 componentes captura el 95% de la
varianza contenida en los datos originales.
Percent Variance Captured by PCA Model

Principal Eigenvalue % Variance % Variance
Component of Captured Captured
Number Cov(X) This PC Total
--------- ---------- ---------- ----------
1 2.86e+000 47.65 47.65
2 9.46e-001 15.76 63.41
3 5.83e-001 9.72 73.13
4 4.04e-001 6.73 79.86
5 3.05e-001 5.09 84.95
6 2.02e-001 3.36 88.31
7 1.25e-001 2.08 90.39
8 1.04e-001 1.73 92.12
9 9.39e-002 1.57 93.68
10 7.32e-002 1.22 94.90
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Modelo PCA para huecos en HV(AT)
Loadings (cargas) de PC1
Los loadings o cargas indican la contribucin (peso) de
cada muestra de cada variable en la construccin de la
Primera componente principal.
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Explotacin del modelo
Proyecin de huecos con origen en MV(HV)
Solo se representa PC1-PC2 de las 10 PC que hay
Lnea a trazos azul indica el umbral T
2
del modelo en PC1-PC2
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Explotacin del Modelo
Evaluacin de los ndices T
2
y Q
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Explotacin del Modelo
Evaluacin de los ndices T
2
y Q
En la ampliacion observamos como el ndice Q permite
discriminar huecos con origen diferente (MT/HV)









Compromiso en la eleccin de los lmites (umbral de
confianza): Falsos positivos / Falsos negativos.
Falso
Negativo
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
rboles de decisin para determinar
el origen de perturbaciones
Huecos con origen conocido:




Atributos: Origen:
- Duracin -
MV/HV
- Profundidad

Modelo: rbol C4.5

Explotacin : origen nuevos datos ?





0 5 10 15
0
0.2
0.4
0.6
0.8
1
1.2
cycles
V
o
l
t
a
g
e

i
n

p
u

MV
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
rboles de decisin (I)
Los datos
4 Subestaciones 132/25kV





Huecos de tensin:
Duracin
Profundidad
H%-Duration(ms)
20 40 60 80
0
200
400
600
800
0 200 400 600 800
20
40
60
80 MV
HV
Duration
H%
H%
H%-Duration(ms)
10 20 30 40 50 60
0
200
400
600
800
0 200 400 600 800
10
20
30
40
50
60 MV
HV
Duration
H%

H%-Duration(ms)
Duration H%
10 20 30 40 50 60
0
200
400
600
800
0 200 400 600 800
10
20
30
40
50
60 MV
HV
H%-Duration(ms)
20 40 60
0
200
400
600
800
0 200 400 600 800
10
20
30
40
50
60
70
MV
HV
Duration
H%

H%
a) b)
c)
d)
Origin
Monitor
MV
instances
HV
instances
Total
instances
A1 24 92 116
A2 20 91 111
B 37 87 124
C 8 98 106
ALL 89 368 457
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
rboles de decisin (II)
El modelo:









Algoritmo: C4.5 (Quinlan)
ID3 (Inductive Decision trees)
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
rboles de decisin (III)
Resultados comparativos







Confusion
matrix
Model

A1 A2 B C ALL
class MV HV MV HV MV HV MV HV MV HV
MV 9 15 8 12 31 6 1 7 51 38 Real Data
HV 4 88 5 86 5 82 2 96 12 356
TP rate 0.375 0.957 0.4 0.945 0.838 0.943 0.125 0.98 0.573 0.967
FP rate 0.043 0.625 0.055 0.6 0.057 0.162 0.02 0.875 0.033 0.427
Precision 0.692 0.854 0.615 0.878 0.861 0.932 0.333 0.932 0.81 0.904

Success rate 0.836 0.846 0.911 0.915 0.890

) /( FN TP TP rate TP + =
) /( TN FP FP rate FP + =
( ) FP TP TP recision P + = /
( ) Total TN TP e SuccessRat / + =
TN FP FN TP Total + + + =
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
rboles de decisin (IV)
Explotacin cruzada de modelos
Confusion
matrix
Model

A1 A2 B C
Real Data class MV HV MV HV MV HV MV HV
MV - - 11 13 4 20 0 24 A1
HV - - 2 90 0 92 0 92
MV 9 11 - - 3 17 0 20 A2
HV 5 86 - - 1 90 0 91
MV 28 9 8 29 - - 0 37 B
HV 2 85 4 83 - - 0 87
MV 2 6 4 4 0 8 - - C
HV 9 89 8 90 2 96 - -

Model

A1 A2 B C
Real Data class MV HV MV HV MV HV MV HV
A1 TP rate 0.458 0.978 0.167 1 0 1
FP rate 0.02 0.542 0 0.833 0 1
Precision 0.846 0.874 1 0.821 0 0.793
Success rate

0.87 0.827 0.793
TP rate 0.45 0.945 0.15 0.989 0 1
FP rate 0.055 0.55 0.011 0.85 0 1
Precision 0.643 0.887 0.75 0.841 0 0.82
A2
Success rate 0.855

0.837 0.82
TP rate 0.757 0.977 0.216 0.954 0 1
FP rate 0.023 0.243 0.046 0.784 0 1
Precision 0.933 0.904 0.667 0.741 0 0.702
B
Success rate 0.911 0.733

0.702
TP rate 0.25 0.908 0.5 0.918 0 0.98
FP rate 0.092 0.75 0.082 0.5 0.02 1
Precision 0.182 0.937 0.333 0.957 0 0.923
C
Success rate 0.855 0.886 0.905



Model A1 A2 B C
Real Data class MV HV MV HV MV HV MV HV
TP rate 0,600 0,942 0,333 0,949 0,135 0,989 0 1
FP rate 0,058 0,400 0,051 0,667 0,011 0,865 0 1
Precision 0,130 0,870 0,080 0,920 0,025 0,975 0 1
Complete dataset
except those from
modelled
substation
Success rate 0.877 0.827 0.856 0.769
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Diagnstico de perturbaciones Basado
en Casos
Casos?


R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Casos:
(Perturbaciones , incidencias)
Eventos
Formas de onda
Subestaciones
PQ
Monitor
Centro
Control de Red
incidencias
CASO=[evento, incidencia]
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Razonamineto Basado en Casos
Estrategia de inferencia basada en la Recuperacin,
Revisin, Reutilizacin y Retencin de casos o ejemplos
similares.
Solution
Diagnostic

CASE -
BASE
(diagnosed
sags)
Revise
Proposed solution Confirmed
solution
?
Retrieve
Retain
R
e
u
s
e
INCIDENCIAS
EVENTOS
casos
Localizacin:
( MT/AT, Subestacin, Parque, Lnea, Dispositivo)

Causa:
(Climatologa, avera, trabajos programados, etc.)

Efectos:
(Disparo proteccin, etc.)
NUEVO EVENTO
POSIBLE INCIDENCIA
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Diagnstico Perturbaciones
1. Determinacin del tipo de fallo (F-T, F-F, 2F-T,3F-T) por
componentes simtricas (Bollen)
2. Recuperacin: Clculo semejanza:
2. A) ATRIBUTOS:
Distancias poderadas de
atributos

2. B) FORMAS DE ONDA:
Alineacin dinmica
de la tensin
caracterstica(DTW)
___
1
___
) , (
) , (
B
i
n
i
A
i i
B A
X X dist W
S S DIST

=
=
=
SALT 9 Transmission Single phase trip. Successful reclose in one end line.
SALT 15 Distribution Single phase trip
SALT 17 Transmission Single phase trip



a)







b)









c)








d)

R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP












Soft: BD-Acces, Visual Basic, C++, Matlab,
Visual.net
Visualizador temporal
Conciliacin
Clculo atributos
Actualizacin registros
Clasificador
Diagnsticos
Integracin


Pronstico de demanda elctrica


Modelo numrico: regresin
Las mejoras de Raul :
- Sistema Experto para correccin del pronstico
- Mejoras Razonamiento Basado en Casos
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Pronstico de
demanda elctrica:
Motivacin: Pronstico de la demanda:
Cuanta potencia espera servir?
Donde y cuando la potencia debe ser entregada?
Consideraciones:
La carga punta es el valor mas importante para la planificacin debido a que es la que tiene el impacto
mas fuerte en los requerimientos del sistema.
La carga punta anual para las compaas elctricas es fcil de obtener debido a que mantienen
lecturas de las mismas.
Informacin disponible:
Localizacin fsica de elementos de consumo
Mediciones de consumo: Registros temporales.
Condiciones de contorno adicionales
Temporal:
Dia de la semana (lunes /martes/ ../domingo)
Estacionalidad (verano / inviero, calor / fro, etc.)
Eventos especiales (ftbol, elecciones, festividad, etc.)
Espacial:
Regional(costa, montaa, valle, etc)
Tipo zona (residencial, urbana, industrial, demografa, etc.)
Otras:
Prediccin tiempo: Calor -> Consumo Aire Acond. / Fro -> Calefaccin elctrica.
Previsin de crecimiento urbano /industrial, etc.
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Pronstico:
Modelo Polinomial curve-fitting
Aproximacin polinmica,L
n
(t) (mnimos cuadrados) de los histricos de
carga (6 aos aprox.) en cada subestacin, (n):


Aconsejabe polinomio de 3r orden para la predicci a 2/3 aos vista





Caractersticas:
Mtodo numrico-> Clculo.
Aproximacin general (tendencia). Filtra determiandos comportamientos.
No tiene en cuenta las particularidades
Necesidad de ordenar (seleccionar) los datos para predicciones particulares.
n n n n n
d t c t b t a t L + + + =
2 3
) (
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP

Pronstico horario para domingo
Explotacin del modelo
El consumo por encima de la contratacin se penaliza fuertemente.
Por tanto es habitual contratar por encima del valor esperado.
Disponer de un pronstico facilita la contratacin justa en todo momento.


Estimacin numrica
Para un da de la semana
Potencia contratada
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Incorporacin de conocimiento
Factores que intervienen en la demanda











La consideracin de estos factores en el
modelo de prediccin llevar a resultados
ms precisos.
Herramientas:
SE
CBR
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Incorporacin de un SE
en el pronstico (R.Vilcahuaman)
La base de conocimiento del sistema experto puede ir creciendo de acuerdo a
la cantidad de informacin que se cuente para cada nodo en particular.
Del conocimiento se extraen las reglas
Su importancia en el
pronstico puede ser
matizada por el usuario

Beneficio:
Pronstico ms individualizado.
Margen de confianza respecto a la prediccin numrica.

Inconvenientes:
Codificacin del conocimiento:
O demasiado genrico: Poco eficiente.
O a medida para cada nodo: Elevado coste de diseo.
Ajuste para cada nodo
Necesidad: Automatizacin del uso del conocimiento








Se procedi a una simulacin de pronostico de demanda con una base real de
datos de 3 aos, se simulo para un da laborable y se presenta los
pronsticos horarios para un mes determinado en el futuro.




K, CF
INSEGURAS
NORMALES
SEGURAS
BAJA
ALTA
NORMAL
BAJA
MEDIA
BAJA
ALTA
NORMAL
INFLACIN
INVERSIONES
CRECIMIENTO
POBLACIONAL
INFLACIN

ALTA
Mercado
Regulado
Mercado
Libre
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Pronstico con CF+SE:
Pronstico
mensual
prximos
4 aos
Pronstico horario
segn tipo de zona
Mximo
Promedio
Mnimo
Pronstico
horario
jueves
laboral
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Pronstico con CF+CBR
(R.Vilcahuaman)

New probl em
CASE-
BASE
Revi s e
Propos ed
s ol ut i on
Conf i rmed
s ol ut i on
?
Ret ri eve
Ret ai n
R
e
u
s
e
Adapt at i on
Cas e Memory
Probl em
Space
Sol ut i on
Space

New probl em
CASE-
BASE
Revi s e
Propos ed
s ol ut i on
Conf i rmed
s ol ut i on
?
Ret ri eve
Ret ai n
R
e
u
s
e
Adapt at i on
Cas e Memory
Probl em
Space
Sol ut i on
Space
) ( ) ( ) ( t L t L t L
CBR CF P
=
) ( , t L t
? ) ( = t L t
) (t L
R
) (t L
CBR
Ajuste fino del pronstico:

Para cada da se ajusta la curva polinomial (CF) con el comportamiento
recuperado de das similares. (ej. Eventos especiales, festivos, etc.)
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Futura: Pronostico con
Curve-fitting + CBR+ SE



Pronstico: L(t)=?
Pronstico grueso: extrapolacin de datos (Curve-fitting) en el punto de
inters:

Ajuste fino del pronstico: Para cada da de la semana (L,M,X,J,V,S,D)
en el ms de inters:

Recuperacin de casos similares (igual mes ltimo ao): LR(T)
Adaptacin de los casos recuperados: SE, con informacin
socioeconmica -K(t)- del punto a pronosticar:







n n n n CF
d t c t b t a t L + + + ~
2 3
) (
( ) h d m a t con t L t t r , , , ) ( , ) ( = =
) ( , ) ( t L t t r =
Punto de prediccin
m
d
h
Un ao
) ( ) ( ) ( t L t L t L
CBR CF P
=
) ( ) ( t K L t L
R CBR
=
Registros histricos
para cada punto de medida.

R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Resultados
0
0,5
1
1,5
2
2,5
ANN Sas package Evol. Prog. Futura
0
0,5
1
1,5
2
2,5
ANN Sas package Evol. Prog. Futura
% Error
Conclusiones
R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Conclusiones

Supervisar supone detectar y diagnosticar fallos
automticamente a partir del conocimiento redundante
de ste. Existen mltiples soluciones de acuerdo con el
conocimiento que tengamos del proceso.

La minera de datos ofrece un enfoque metodolgico para
la explotacin eficiente de datos con vistas a mejrorar los
actuales sistemas de supervisin.

No existe una solucin nica: mltiples tcnicas, mtodos y
modelos incluso para un dominio de aplicacin concreto.




R. Vilcahuamn J. Melndez, IIiA/UdG/FIEE/UNCP
Conclusiones II
Sistemas de distribucin elctrica:
Procesos complejos
Minera de datos para Monitorizacin de calidad de onda.
Obtencin perturbaciones
Caracterizacin: atributos, formas de onda,
Mltiples modelos a partir de histricos
Explotacin del modelo: diagnstico de
perturbaciones, localizar su origen

Pronstico consumo elctrico:
Sistema hbrido mejora los resultados
CF + CBR + ES

Potrebbero piacerti anche