Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
2 semestre - 2011
Belm - PA
2011
__________________________________________
Prof. Dr. Joo Crisstomo Weyl Albuquerque Costa
ORIENTADOR
__________________________________________
Profa. Dra. Valquria Gusmo Macedo
CO - ORIENTADORA
__________________________________________
Prof. Dr. Aldebaro Barreto da Rocha Klautau Junior
MEMBRO DA BANCA EXAMINADORA
__________________________________________
Prof. Dr. damo Lima de Santana
MEMBRO DA BANCA EXAMINADORA
__________________________________________
Msc. Vinicius Duarte Lima
MEMBRO DA BANCA EXAMINADORA
__________________________________________
Prof. Msc. Ronaldo Nonato Silva Lima
DIRETOR DA FACULDADE DE ENGENHARIA
ELTRICA
Dedicatria
Agradecimentos
minha famlia, que sempre me incentivou ao trabalho e ao estudo, e cujo sentimento
de amor e fraternidade eu procuro levar aonde quer que eu v. Agradeo especialmente aos
meus irmos Gabriel e Lucian, por serem as pessoas com as quais tive a maior convivncia
at hoje, tendo com eles aprendido muito sobre o que o verdadeiro companheirismo.
minha namorada, Satie, pelo amor, carinho, pacincia, e apoio em todo e qualquer
momento. Agradeo tambm pela ajuda na confeco deste trabalho.
A todos os meus amigos e companheiros, em especial ao Alan, Amagol, Bruno, Csar,
Biro, Diego, Donza, Felipe, Flvio, Luiz Augusto, Mauro Andr, Pingarilho, Renan, Roberto
Medeiros, Thiago, e Wilson.
Ao LEA e seus integrantes, responsvel por parte significativa do meu aprendizado
profissional e humano enquanto estudante universitrio. Agradeo especialmente ao Roberto
Menezes, Lamartine Souza, e Vincius Duarte, que me orientaram durante meu perodo de
estgio.
Aos professores do curso de Engenharia Eltrica, que atravs dos seus ensinamentos e
desafios me fazem sentir orgulho imenso em estar me formando.
Resumo
A tecnologia de acesso em banda larga Linha Digital do Assinante, ou DSL (do ingls
Digital Subscribe Line) sofre distrbios originados por basicamente quatro tipos de rudo:
crosstalk, impulsivo, rudo de radiofreqncia e rudo de fundo. Identificar qual deles afeta o
desempenho de um trfego DSL em um determinado momento pode ser uma informao
importante para um melhor gerenciamento do enlace local por parte das operadoras de
telefonia, permitindo que algoritmos que atuam nos modems se adaptem durante a conexo, e
tambm facilitando saber qual a origem de certos problemas no servio prestado ao usurio.
Este trabalho prope o reconhecimento de padres de rudo na parte do enlace de cobre do
VDSL2, a mais recente tecnologia DSL, a partir da aplicao da tcnica Mquinas de Vetores
de Suporte (Support Vector Machines SVM) sobre um conjunto de informaes estatsticas
de gerenciamento, disponveis na camada de aplicao atravs do Protocolo Simples de
Gerncia de Rede (Simple Network Management Protocol SNMP).
Abstract
The Digital Subscriber Line (DSL) broadband technology is mainly disturbed by four
types of noise: crosstalk, impulse noise, radiofrequency noise and background noise. The
identification of which one is limiting the performance of the DSL traffic while the system is
running can be useful for a better management of the local loop by the telephone companies,
allowing modem algorithms to adapt to different noise situations, and making easier the task
of finding some deployment problems sources. This work proposes the noise pattern
recognition on the copper local loop of VDSL2, the most recent DSL technology, through the
application of Support Vector Machines (SVM) on a set of statistical management
information available at the application layer through the Simple Network Management
Protocol (Simple Network Management Protocol-SNMP).
Lista de Figuras
Figura 1 - O enlace local de telefonia (Golden, Dedieu, & Jacobsen, 2004). .......................... 12
Figura 2 Diagrama esquemtico de uma rede DSL. .............................................................. 13
Figura 3 - Diviso do espectro de frequncia no ADSL........................................................... 14
Figura 4 - Diagrama esquemtico geral de um sistema de comunicao digital. ..................... 15
Figura 5 NEXT (Golden, Dedieu, & Jacobsen, 2004)........................................................... 17
Figura 6 FEXT (Golden, Dedieu, & Jacobsen, 2004). .......................................................... 17
Figura 7 - Estrutura da rvore MIB. ......................................................................................... 19
Figura 8 DSLAM obtm as mtricas MIB de cada enlace DSL (Ericsson, 2009). ............... 20
Figura 9 - Mquina de aprendizado. ......................................................................................... 21
Figura 10 - Alguns exemplos de dgitos manuscritos do servio postal americano. ................ 23
Figura 11 - Os pontos vermelhos podem pertencer a um nmero infinito de funes. ............ 25
Figura 13 - Variao do risco estrutural em funo da dimenso VC. ..................................... 26
Figura 14 - Funes diferentes possuem capacidades diferentes (Weston). ............................ 27
Figura 15 - Conjuntos de dados linearmente separveis. ......................................................... 27
Figura 16 - Definindo a margem do classificador. ................................................................... 28
Figura 17 - Classificador de margem rgida. Os vetores de suporte so aqueles situados em
cima da margem (Schlkopf, 2000). ........................................................................................ 29
Figura 18 - Mapeamento no espao de caractersticas (Schlkopf, 2000). .............................. 31
Figura 19 - Variveis de folga . ................................................................................................ 35
Figura 20 - Aplicao do SVM em classificao de dados no linearmente separveis. ......... 37
Figura 22 - Disposio dos equipamentos no cenrio de medio. .......................................... 38
Figura 23 Arquivo ".csv" contendo as MIB. ............................................................................ 42
Figura 24 - Fase inicial da treinamento para determinao dos vetores de suporte. ................ 44
Figura 25 - Fase de classificao. ............................................................................................. 44
Lista de Tabelas
Tabela 1 - Tipos de Kernel. ...................................................................................................... 33
Tabela 2 -Tipos de rudo e enlaces utilizados. ......................................................................... 40
Tabela 3 - Variaes de crosstalk utilizados. .......................................................................... 40
Tabela 4 - Tabela de confuso. ................................................................................................ 45
Tabela 5 Resultados da classificao para o kernel Gaussiano (com =2). .......................... 46
Tabela 6 - Exatido e preciso para o kernel gaussiano. .......................................................... 46
Tabela 7 - Resultados da classificao para o kernel Polinomial (com d=2). .......................... 47
Tabela 8 - Exatido e preciso para o kernel polinomial. ........................................................ 47
Tabela 9 - Resultados da classificao para o kernel linear. .................................................... 48
Tabela 10 - Exatido e preciso para o kernel linear. ............................................................... 48
Tabela 11 Conjunto das 59 mtricas MIB selecionadas ........................................................... 54
Tabela 12 Mtricas de 1 a 6 (abscissas) pelas mtricas de 1 6 (ordenadas) ......................... 58
Tabela 13 Mtricas de 1 a 6 pelas mtricas de 7 12 .............................................................. 58
Tabela 14 Mtricas de 7 a 12 pelas mtricas 1 a 6 ................................................................... 59
Tabela 15 Mtricas de 7 a 12 pelas mtricas de 7 a 12 ............................................................ 59
Lista de Siglas
ADSL
ADSL2+
AM
Amplitude Modulation
ATU-C
ATU-R
AWGN
CO
Central Office
DMT
Discrete Multi-tone
DSL
DSLAM
FEXT
Far-end Crosstalk
FFT
HTTP
IETF
IP
Internet Protocol
ISDN
MIB
NEXT
Near-End Crosstalk
PSD
PSTN
QAM
REIN
RFC
RFI
SNMP
SNR
Signal-to-Noise Ratio
SVM
VC
Vapnik-Chervonenkis
VDSL2
VTU-R
Sumrio
1 INTRODUO ..................................................................................................................... 8
1.1 OBJETIVO DO TRABALHO .......................................................................................... 9
1.2 REVISO BIBLIOGRFICA E ESTADO DA ARTE .................................................... 9
1.3 ORGANIZAO DOS CAPTULOS ............................................................................ 10
2 TECNOLOGIA DSL ........................................................................................................... 12
2.1 TIPOS DE DSL: .......................................................................................................... 14
2.2 RUDO EM SISTEMAS DE COMUNICAO .......................................................................... 15
2.3 TIPOS DE RUDO EM SISTEMAS DSL................................................................................. 16
2.3.1 Crosstalk................................................................................................................... 16
2.3.2 Rudo Eltrico Impulsivo Repetitivo ........................................................................ 18
2.3.3 Rudo de Radiofrequncia ........................................................................................ 18
2.3.4 Rudo de Fundo ........................................................................................................ 18
2.4 MTRICAS MIB EM DSL .................................................................................................. 19
3 MQUINAS DE VETOR DE SUPORTE ......................................................................... 21
3.1 APRENDIZADO DE MQUINA ............................................................................................ 21
3.1.1 Aprendizado Supervisionado.................................................................................... 22
3.1.2 Aprendizado No-supervisionado ............................................................................ 23
3.2 MQUINAS DE VETOR DE SUPORTE.................................................................................. 24
3.2.1 Complexidade da Hiptese e Dimenso de Vapnik-Chervonenkis (VC) ................. 24
3.2.2 Classificador de Margem Rgida e o Caso Linearmente Separvel ....................... 27
3.2.3 Kernels ..................................................................................................................... 31
3.2.4 Condio de Existncia de um Kernel ..................................................................... 33
3.2.5 Classificadores de Vetor de Suporte ........................................................................ 34
4 METODOLOGIA................................................................................................................ 38
4.1 CENRIO DE MEDIO ..................................................................................................... 38
4.2 APLICAO DO ALGORITMO DE APRENDIZAGEM ............................................................. 41
4.2.1 Ferramentas Computacionais .................................................................................. 41
4.2.2 Fase de Seleo dos Dados Relevantes.................................................................... 41
4.2.3 Fase de Treinamento do SVM .................................................................................. 43
4.2.4 Fase de Classificao............................................................................................... 44
5 RESULTADOS .................................................................................................................... 45
6 CONCLUSO...................................................................................................................... 49
6.1 PROPOSTAS DE TRABALHOS FUTUROS ............................................................................. 49
REFERNCIAS BIBLIOGRFICAS ................................................................................. 51
APNDICE A CONJUNTO TOTAL DAS MTRICAS MIB ..................................... 54
APNDICE B DIAGRAMAS DE DISPERSO PARA O CASO DO CROSSTALK . 57
APNDICE C ARQUIVOS DE RUDO UTILIZADOS NAS MEDIES ................. 60
CAPTULO 1
1 INTRODUO
O rudo em um sistema de comunicao um dos fatores que causa maior
impacto no desempenho do mesmo. No caso de sistemas do DSL, a presena
principalmente do crosstalk (em portugus, diafonia, porm o termo em ingls ser
utilizado devido sua ampla aceitao) e do rudo impulsivo causam problemas para
operadoras e usurios, podendo limitar bastante o uso da tecnologia. A possibilidade da
identificao de qual tipo de rudo ocorre em um enlace DSL em um determinado
momento se torna deste modo importante para aqueles que vendem o produto, pois
tero um meio de monitorar melhor a sua rede nesse aspecto, tambm permitindo que
algoritmos que atuam nos modems se adaptem durante a conexo, e facilitando saber
qual a origem de certos problemas no servio prestado ao usurio (Yang, Dasgupta,
Redfer, & Ali).
Uma maneira de resolver esse problema seria atravs da utilizao de tcnicas de
inteligncia computacional, que abrangem uma larga gama de algoritmos e teorias, entre
eles a aprendizagem de mquina. Mquinas de Vetor de Suporte (Support Vector
Machines SVM) uma dessas tcnicas, sendo baseada na teoria do aprendizado
estatstico, desenvolvidas por Vladimir Vapnik e Alexey Chervonenkis (Vapnik, 1998).
A ideia principal do SVM a seguinte: dado um conjunto de vetores de dois padres
diferentes, realizar a projeo dos mesmos em um espao de igual ou maior dimenso e
identificar o subconjunto deles que permita o clculo de uma funo discriminante para
realizar a classificao de novos vetores. No caso do problema de identificao de rudo
em DSL, o conjunto de vetores so dados da Base de Informao de Gerenciamento, ou
MIB (do ingls Management Information Base) provenientes do Multiplexador de
Acesso DSL, ou DSLAM (do ingls Digital Subscriber Line Access Multiplexer),
acessveis atravs do Protocolo Simples de Gerncia de Rede (Simple Network
Management Protocol SNMP) da internet. SVM considerado o estado da arte em
aprendizado de mquina e minerao de dados, possuindo uma slida fundamentao
terica e sendo capaz de lidar com problemas de alta dimensionalidade (Wu, et al,
2008). A aplicao desta tcnica ser a principal contribuio deste trabalho para
encontrar a relao entre a estatstica das mtricas obtidas e a presena de um
determinado tipo de rudo.
da
tcnica
de
aprendizado
estatstico
SVM
desenvolvida
10
Captulo 1 Introduo.
11
12
CAPTULO 2
2 TECNOLOGIA DSL
O sistema DSL a tecnologia de acesso mais utilizada por usurios residenciais
e comerciais (Broadband, 2008). Ela consiste na transmisso de dados, vdeo e udio,
em alta velocidade, atravs da rede telefnica. A caracterstica principal desta
tecnologia o fato de ela ter sido construda para transmitir sinais digitais em banda
larga aproveitando a infra-estrutura de telefonia j existente (que transmite sinais
analgicos de voz), cuja existncia remete ao comeo do sculo XX. A estrutura da rede
telefnica foi criada para operar na estreita faixa de voz, que vai at 4 kHz. Com o
advento da eletrnica e dos computadores, tornou-se necessria a pesquisa para
encontrar meios de transmitir informaes digitais, e a possibilidade de usar faixas
maiores de frequncia para a composio dos sinais e garantir a qualidade do servio
tornou-se um objetivo a ser alcanado. Devido infra-estrutura telefnica j existente e
popularizada pelo mundo, pensou-se em utiliz-la tambm para o fim da comunicao
digital. A utilizao da rede telefnica foi muito importante para a popularizao do
DSL, principalmente porque permitiu que o acesso em banda larga fosse oferecido a
preos muito menores em comparao com a fibra ptica, por exemplo.
De modo a compreender o funcionamento desta tecnologia, necessrio
compreender inicialmente como funciona a Rede Telefnica Pblica Comutada, ou
PSTN (do ingls Public Switched Telephone Network). A arquitetura bsica de um
sistema de telefonia pode ser vista na Figura 1:
13
14
15
manter seus usurios fiis ao servio oferecido (Papandriopoulos & Evans, SCALE: A
Low-Complexity Distributed Protocol for Spectrum Balancing in Multiuser DSL
Networks, 2009). A criao do VDSL2 representa esta tentativa de manter a tecnologia
ainda bastante competitiva, com a faixa de frequncia se estendendo at 30 MHz e
prometendo at 100 Mbps em um trfego simtrico para pequenos enlaces (at 1500 m).
O trfego assimtrico tambm permitido, com velocidade de 150 Mbps para
downstream e 50 Mbps para o upstream. A expanso da fibra ptica a partir da central
nos enlaces um dos fatores que permite ao VDSL2 alcanar taxas to grandes em
relao s tecnologias DSL anteriores, especificamente na modalidade de fibra at o
gabinete (Fiber to the Curb - FTTC), com o VDSL2 ligando a fibra ptica a
consumidores residenciais, e na fibra at o prdio (Fiber to the Building - FTTB),
ligando a fibra ptica a consumidores comerciais principalmente. VDSL2 traz
mudanas significativas em termos de infra-estrutura, visto que agora os DSLAMs
(antes normalmente localizados dentro das COs) tero que ser posicionados em
gabinetes situados prximos ao usurio (Eriksson & Odenhammar, 2006).
16
,
onde
(2.1)
. Pode-se
dizer ento que a capacidade do canal a taxa mxima de informao que se pode
transmitir atravs do mesmo, dada em bits/Hz, alcanada em funo da distribuio de
probabilidade do emissor. Logo, caso a taxa do canal seja
, pode haver um
aumento no comprimento dos blocos de informao que garanta que sua chegada ao
receptor sem erro (MacKay, 2003). Caso
(2.2)
a Razo Sinal-Rudo, RSR
17
2.3.1.1 NEXT
O crosstalk do tipo NEXT (do ingls Near-End Crosstalk) o acoplamento que
ocorre em outro par tranado no sentido contrrio ao do sinal original. Sua ocorrncia
mais intensa nas extremidades do enlace, mas pode ocorrer tambm no meio dele
(Golden, Dedieu, & Jacobsen, 2004). Este tipo de rudo ocorre em transmisses DSL
simtricas. A Figura 5 exemplifica a ocorrncia do NEXT:
(2.3)
pares interferentes,
proporcional ao
18
| | ,
onde
(2.4)
sofreu perdas devido distncia percorrida, enquanto que o FEXT sofre atenuao ao
longo da linha e depois afeta o sinal. A partir dos modelos apresentados, percebe-se que
a o nvel de interferncia aumenta medida que aumenta a frequncia de operao do
DSL, e tambm quanto maior a quantidade de interferentes conectados no mesmo
binder (cabo de proteo revestindo um conjunto de pares tranados), maior a potncia
do rudo (Golden, Dedieu, & Jacobsen, 2004).
2.3.2 Rudo Eltrico Impulsivo Repetitivo
O Rudo Eltrico Impulsivo Repetitivo, ou REIN (do ingls Repetitive Electric
Impulsive Noise) o rudo que se caracteriza por pulsos eltricos de curta durao, mas
de potncias muito elevadas, ocorrendo com periodicidade. Sua interferncia gerada
por qualquer pulso eletromagntico que ocorra nas proximidades do enlace, e, portanto
sua fonte no facilmente identificada, sendo normalmente proveniente da atividade
humana e transitrios causados por chaveamento (Golden, Dedieu, & Jacobsen, 2004).
A potncia do rudo impulsivo pode ser grande o suficiente para muitas vezes
interromper a transmisso em sistemas DSL.
2.3.3 Rudo de Radiofrequncia
o rudo causado pela interferncia de ondas de rdio, tendo como origem
normalmente transmisses de emissoras usando modulao AM ou de rdio amador.
um rudo que possui uma faixa estreita de frequncia, entre 2,5 e 5 kHz, sendo que a
faixa do AM localiza-se entre 0,5 e 1,6 MHz, e a do amador entre 1,8 e 29 MHz, que
tambm compartilhada pelo ADSL e pelo VDSL2. Em comparao com o crosstalk e
o rudo impulsivo, o impacto do rudo de radiofrequncia possui menor importncia. No
entanto, na frequncia do VDSL2, a potncia do rudo pode chegar a -30 dBm e 0 dBm,
para rdio AM e amador respectivamente, considerando a transmisso em modo
diferencial, o que leva o RFI estar includo na padronizao do VDSL2 (Nedev, 2003).
2.3.4 Rudo de Fundo
O rudo de fundo caracteriza-se por estar presente no sistema mesmo quando a
fonte no est emitindo. Ele criado pela composio das interferncias de diversas
fontes externas ao sistema de comunicao. Em DSL, ele possui como padro a
19
RFC 1157
SNMP Protocol
RFC 1213
20
Figura 8 DSLAM obtm as mtricas MIB de cada enlace DSL (Ericsson, 2009).
21
CAPTULO 3
dados de entrada
, com
, onde
um vetor de
. A
, com
, se o desempenho em
22
, com
representando
e a sada .
. O
objetivo final do aprendizado sempre obter uma hiptese que se adqe a esse critrio,
se no perfeitamente, pelo menos aproximadamente, portanto ela no deve ser
modificada nesta etapa. Os dados de treino, validao e teste fazem parte do mesmo
conjunto de dados obtidos de um experimento. Recomenda-se que os dados tenham um
comportamento diversificado (valores no to parecidos, ou que tenham um nmero
diversificado de sadas, e no vrias de somente um tipo, por exemplo) de modo a gerar
uma hiptese generalista.
Tcnicas de aprendizado de mquina so aplicadas para reconhecimento de
padres, viso computacional, robtica, economia, e vrias outras reas onde se deseja
descobrir relaes matemticas dentro de um conjunto de dados. Duas categorias de
aprendizado so apresentadas abaixo: supervisionado e no-supervisionado.
3.1.1 Aprendizado Supervisionado
No aprendizado supervisionado, o conjunto de dados de entrada formado por
, onde a -sima entrada da mquina de aprendizado, ou seja, fornecida
mquina a entrada junto sua respectiva sada. Este tipo de situao favorvel para o
algoritmo de aprendizado, j que ele ensinado a dar o resultado correto para
determinada entrada. O aprendizado supervisionado pode ser de dois tipos: classificao
ou regresso. Na classificao, busca-se classificar a sada de uma mquina de
aprendizagem em termos qualitativos, normalmente discretos. O problema atual de
classificao de rudo se enquadra neste caso, j que a sada pertence ao conjunto
23
Friedman, 2009).
24
correspondente
com base nas sadas j fornecidas pelos dados de treino. Um meio comum de alcanar
este objetivo a minimizao do risco emprico (ou erro emprico) em relao aos
dados de treino, dado pela Equao 3.1:
25
|
onde
(3.1)
podem assumir
somente os valores 1 e -1. Porm, nem sempre um erro pequeno para os dados de treino
significa que nos dados de teste o erro tambm ser pequeno, o que pode causar
problemas na generalizao do algoritmo, causando o chamado overfitting1. Isso pode
ser mostrado da seguinte maneira (Weston): dados um conjunto de treino
e um conjunto de teste
espao , para todo
existe
de modo que
e
onde
( )
(3.2)
podem ser relacionadas aos dados de treino e suas sadas, entretanto deve-se encontrar a
verdadeira funo relacionando
funo
O overfitting o fenmeno que ocorre quando, aps o treinamento, a mquina de aprendizado obtm um
desempenho muito bom na classificao dos dados de treino (erro emprico tendendo a zero), porm
obtm um desempenho ruim na classificao dos dados de teste. Esta m classificao ocorre porque a
complexidade da hiptese final gerada acaba por depender somente da forma como os dados de treino
esto distribudos
26
aprendizado, o algoritmo deve ser capaz de minimizar o risco estrutural, dado pela
seguinte Equao 3.3:
(3.3)
onde
o risco emprico e
depende de
, onde
de
1998).
. De maneira mais geral, a dimenso VC considerada uma medida da
capacidade de uma funo, sendo capacidade uma medida da complexidade de uma
funo. Se uma famlia de funes de alta capacidade for usada para classificao,
possvel que ocorra overfitting, enquanto que famlias de funes com baixa capacidade
podem acarretar em um risco emprico relativamente alto, como exemplificado na
Figura 13.
Na Figura 14, esta situao fica mais explcita para o conjunto de dados no
linearmente separvel das bolas opacas e das bolas vazadas. Nota-se que, da esquerda
para a direita, funes de dimenso VC maior so utilizadas para se ajustarem melhor
aos dados de treino.
27
de modo
que:
{
Onde
(3.4)
um conjunto de dados linearmente
(3.5)
28
ser positivo, e
(3.7)
o conjunto
, a margem geomtrica
pode ser
(3.9)
J que a margem deve ser maximizada, o hiperplano timo pode ser encontrando
resolvendo-se o seguinte problema de otimizao:
sujeito {
(3.10)
29
O problema descrito pode ser mais bem visualizado atravs Figura 17, que
apresenta um caso de classificao bidimensional:
Figura 16 - Classificador de margem rgida. Os vetores de suporte so aqueles situados em cima da margem
(Schlkopf, 2000).
(3.11)
, caracterizando um
(3.12)
30
(3.13)
(3.14)
e desempenha um
, no tendo
importncia para a otimizao. Caso uma das restries ativas sofra alguma variao,
seu
sensibilidade da soluo tima face restrio. Caso ocorra uma mudana em uma
restrio inativa, seu correspondente
, e, portanto, se d
(3.15)
. A funo de
(3.16)
Uma analogia (Schlkopf, 2000) (Burges, 1998) pode ser feita entre o
classificador apresentado e a mecnica. Atravs da soluo apresentada, pode-se
considerar que cada vetor de suporte exerce uma fora perpendicular sobre uma folha
31
rgida localizada sobre o hiperplano timo, de modo a manter o sistema sobre equilbrio.
A restrio dada pela Equao 3.12 determina que a soma das foras sobre a folha
igual a zero, e a Equao 3.13 tambm determina que o torque seja igual a zero, j que
(3.17)
3.2.3 Kernels
Quando dois padres no so linearmente separveis, e sua distribuio no
espao complexa o suficiente para no permitir o uso adequado de classificadores de
hiperplano de separao timo, faz-se necessrio realizar um mapeamento dos dados de
treino em um espao de caractersticas de maior dimenso, de modo que no novo espao
criado eles sejam linearmente separveis, como mostrados na Figura 18.
em um
32
(3.18)
onde
(3.19)
monmios. Esta
Sendo uma
medida de similaridade entre dois elementos, o kernel pode ser considerado uma funo,
na forma:
(3.20)
onde
Em que
o mapeamento de
(3.21)
e retorna um
(3.22)
33
Tabela 1 - Tipos de Kernel.
Kernel
Tipo de classificador
Polinmio de grau
Perceptron Multicamadas
(3.23)
por exemplo, pode ser mostrado como o produto de dois mapeamentos polinomiais,
considerando o espao original tendo duas dimenses, como segue abaixo:
(3.24)
(3.25)
pode ser
. Ento
(3.26)
Para todo
(3.27)
Respeitada a condio,
34
quadrtica pode no ter soluo. Ainda assim, caso um kernel que no siga a condio
de Mercer resulte numa matriz positiva definida para um determinado conjunto de
dados de treino, o problema de otimizao quadrtica ter uma soluo tima (Burges,
1998). As funes de kernel possuem as seguintes propriedades, dado que
kernels definidos em
matriz simtrica
so
uma
Taylor, 2000):
1.
2.
3.
4.
5.
Estas propriedades demonstram a capacidade de reproduzir kernels a partir de
outros kernels.
Ainda no se possui uma boa noo terica de quando um determinado tipo de
kernel deve ou no ser aplicado em um problema especfico, e a aplicao de um kernel
em um problema complexo um fator de sucesso ou fracasso na realizao do mesmo,
sendo este um grande trunfo e ao mesmo tempo um limitador para o SVM (Burges,
1998). Ainda assim em muitos casos o uso de diferentes kernels pode resultar em
timos resultados. O conceito de kernel como medida de similaridade bastante amplo,
e possui muitas propriedades demonstradas (Hastie, Tibshirani, & Friedman, 2009).
35
(3.28)
minimizar
sujeito {
(3.29)
dada minimizao do erro de treino. Esta funo custo mostra demonstra bem a
capacidade de SVM de encontrar um balanceamento entre a complexidade da hiptese (
atravs do termo ) e a minimizao do risco emprico (dado por
).
36
(3.30)
na restrio dos
(3.31)
(3.32)
(Equao 3.26).
(3.33)
37
38
CAPTULO 4
4 METODOLOGIA
O objetivo deste trabalho classificar corretamente qual o tipo de rudo est
presente na parte do cobre de um enlace VDSL2. importante considerar que neste
trabalho, embora seja uma simplificao, considerado que cada tipo de rudo ocorre
em momentos diferentes (no so simultneos). Os tipos de rudo a serem classificados
so:
Rudo de fundo;
Crosstalk (NEXT/FEXT);
Rudo RFI.
A escolha dos tipos de rudo foi feita com base na norma G-993.1 da ITU
(G.993.1, 2004).
O procedimento para realizar o trabalho divide-se em dois momentos:
1.
2.
39
Gerador de rudo: contm os arquivos de rudo dos diversos tipos descritos, e permite
simular a presena do mesmo no enlace. Ser ligado diretamente ao enlace. O rudo foi
injetado tanto do lado da central como do lado do usurio. Os arquivos de rudo
utilizados so dados no Apndice C. O modelo do gerador de rudo utilizado foi o DLS
5500 da Spirent Communications.
Linha sob Teste: o enlace telefnico fsico real usado para os experimentos. Est
ligado ao DSLAM, ao modem (que representa o usurio remoto), e tambm ao injetor
de rudo, j que deve sofrer influncia do mesmo. No presente trabalho, os
comprimentos de enlace selecionados so 50, 150, e 450 metros, respeitando os limites
do VDSL2. As bitolas dos cabos escolhidas no para medio foram as de 0,4 mm e 0,5
mm, por serem mais as usadas (Golden, Dedieu, & Jacobsen, 2004). importante notar
que neste trabalho sero usados enlaces de uma nica seo de cabo ligando os
terminais.
40
Tabela 2 -Tipos de rudo e enlaces utilizados.
Enlace
Tipo de Rudo
Comprimento(m)
Crosstalk
REIN
Enlace 1 (bitola 0,4 mm)
RFI
50,150,450
Rudo de Fundo
Crosstalk
REIN
Enlace 2 (bitola 0,5 mm)
RFI
Rudo de Fundo
Nmero de interferentes
5
Potncia do rudo
-25.6dBm
10
-23.4dBm
15
-22.4dBm
20
-21.6dBm
25
-21.1dBm
30
-20.6dBm
35
-20.2dBm
40
-19.8dBm
45
-19.5dBm
49
-19.3dBm
41
42
representam os
(4.1)
43
44
45
CAPTULO 5
5 RESULTADOS
Para apresentar os resultados obtidos na classificao dos dados, optou-se por
utilizar a matriz de confuso, comumente utilizada em problemas de classificao. Para
auxiliar na compreenso dos valores usados para medir o desempenho do SVM, a tabela
de confuso foi dada na Tabela 4, cujos elementos so os seguintes:
Tabela 4 - Tabela de confuso.
Classe
+1
-1
Falsos positivos (Fp): nmero de elementos que possui classe -1 e que foram
erroneamente classificados com a classe +1 pelo SVM.
Falsos negativos (Fn): nmero de elementos que possui classe +1 e que foram
erroneamente classificados com a classe -1 pelo SVM.
46
(5.3)
Ressalta-se que o desempenho do classificador ser avaliado para o problema de
classificao de rudo como um todo e tambm para cada classe especfica. Exceo
feita preciso, pois ela existe apenas para as classes especficas. As matrizes de
confuso descritas para os kernels linear, gaussiano, e polinomial de ordem 2 (Tabelas 5
10), representam os resultados para os dados de teste do problema. Os parmetros dos
kernels escolhidos correspondem ao melhor desempenho alcanado, com
(varivel que controla o risco emprico no SVM).
Tabela 5 Matriz de confuso para o kernel Gaussiano (com =2).
Predio
Crosstalk
REIN
RFI
Rudo de
Fundo
Classe
Crosstalk
450
Taxa de
Verdadeiros
Positivos
99,33%
REIN
59
96,29%
RFI
277
33
88,08%
Rudo de Fundo
164
100,00%
95,92%
Mdia
Geral
Exatido
96,15%
Preciso
--
Crosstalk
98,90%
99,55%
REIN
92,18%
96,72%
RFI
89,35%
89,35%
Rudo de Fundo
83,24%
83,24%
47
Predio
Crosstalk
REIN
RFI
Rudo de
Fundo
449
Taxa de
Verdadeiros
Positivos
99,11%
REIN
61
100%
RFI
281
29
90,64%
Rudo de Fundo
20
144
87,80%
Classe
Crosstalk
94,38%
Mdia
Tabela 8 - Exatido e preciso para o kernel polinomial.
Geral
Exatido
94,63%
Preciso
--
Crosstalk
99,11%
100%
REIN
93,84%
93,84%
RFI
85,15%
93,35%
Rudo de Fundo
74,61%
83,23%
48
Predio
Crosstalk
REIN
RFI
Rudo de
Fundo
449
Taxa de
Verdadeiros
Positivos
99,11%
REIN
61
100%
RFI
261
49
84,19%
Rudo de Fundo
16
148
90,24%
Classe
Crosstalk
93,38%
Mdia
Exatido
Preciso
Geral
93,01%
--
Crosstalk
99,11%
100%
REIN
93,84%
93,84%
RFI
80,06%
94,22%
Rudo de Fundo
69,48%
75,12%
49
CAPTULO 6
6 CONCLUSO
Os experimentos em laboratrio mostram que o objetivo inicial da classificao
do rudo em uma rede VDSL2 realizvel. O reduzido nmero de dados de treino e os
resultados satisfatrios obtidos nas medies realizadas em diferentes cenrios mostram
tambm que cada tipo de rudo influencia a estatstica das mtricas MIB de uma
maneira bastante caracterstica, o que facilita o processo de aprendizagem de mquina.
Atenta-se tambm para o fato de que os resultados obtidos no podem ser considerados
como gerais, podendo a correta classificao ser alcanada seguindo o esquema
proposto na metodologia das medies.
Em relao ao mtodo proposto, foi mostrado, com base nos resultados
alcanados, que a aplicao de tcnicas de aprendizagem de mquina s mtricas MIB
pode gerar mais conhecimento sobre a rede do que aquele sendo explcito pelo valor
delas. O fato de essas tcnicas computacionais serem relativamente simples de serem
aplicadas e no interferirem no oferecimento do servio um atrativo para as
operadoras de telefonia e fornecedores do servio VDSL2.
50
51
REFERNCIAS BIBLIOGRFICAS
52
53
54
Mtricas MIB
adslIfAdminStatus
Mtricas MIB
adslAturPerfCurr1DayLoss
adslIfOperStatus
adslAturPerfCurr1DayLprs
adslAtucChanCurrTxRate
adslAtucPerfCurr1DayLols
adslAturChanCurrTxRate
adslAtucPerfCurr1DayInits
adslAtucCurrAttainableRate
adslAtucChanConfInterleaveMaxTxRate
adslAturCurrAttainableRate
adslAturChanConfInterleaveMaxTxRate
adslAtucCurrSnrMgn
adslAtucChanConfInterleaveMinTxRate
adslAturCurrSnrMgn
adslAturChanConfInterleaveMinTxRate
adslAtucCurrAtn
adslAtucConfMaxSnrMgn
adslAturCurrAtn
adslAturConfMaxSnrMgn
adslAtucCurrOutputPwr
adslAtucConfTargetSnrMgn
adslAturCurrOutputPwr
adslAturConfTargetSnrMgn
adslAtucChanInterleaveDelay
adslAtucConfMinSnrMgn
adslAturChanInterleaveDelay
adslAturConfMinSnrMgn
adslAtucProprietaryChanActualInp
adslAtucChanConfMaxInterleaveDelay
adslAturProprietaryChanActualInp
adslAturChanConfMaxInterleaveDelay
adslAtucChanPerfCurr1DayUncorrectBlks
adslAtucProprietaryChanConfXINPminIlvB0
adslAturChanPerfCurr1DayUncorrectBlks
adslAturProprietaryChanConfXINPminIlvB0
adslAtucPerfCurr1DayESs
adslAtucProprietaryPhysXActualLineBitRate
adslAturPerfCurr1DayESs
adslAturProprietaryPhysXActualLineBitRate
adslAtucPerfCurr1DaySesL
loopDiagLoopAttenuationFE
adslAturPerfCurr1DaySesL
loopDiagLoopAttenuationNE
adslAtucChanCrcBlockLength
loopDiagSignalAttenuationFE
adslAturChanCrcBlockLength
loopDiagSignalAttenuationNE
55
adslAtucChanPerfCurr1DayCorrectedBlks
loopDiagSnrMarginFE
adslAturChanPerfCurr1DayCorrectedBlks
loopDiagSnrMarginNE
adslAtucPerfXCurr1DayEcs
loopDiagAttainableBitRateFE
adslAturPerfXCurr1DayEcs
loopDiagAttainableBitRateNE
adslAtucPerfCurr1DayUasL
adslLineXStatusActPsdUs
adslAturPerfCurr1DayUasL
adslLineXStatusActPsdDs
adslAtucPerfCurr1DayLoss
Prev: precedente.
Atn: Atenuao.
Max: Mximo
Min: Mnimo
Mgn:Margem
Tx: Transmissor
56
Rx: Receptor
Blks: Blocos
57
58
59
60
RFI
Potncia: -44 dbm
TS101_270-1v2-0-10_5B19v2-0/Broadcast_RF/-ETSI-VDSL_RF_Diff-Mode_UpA_rfi.enc
Potncia: -54 dbm
TS101_270-1v2-0-10_5B19v2-0/Broadcast_RF/-ETSI-VDSL_RF_Diff-Mode_UpB_rfi.enc