Sei sulla pagina 1di 53

Support

Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Support Vector Clustering na formulao da
segmentao dos consumidores cariocas
sobre o servio de TV Mvel.
Pedro H. M. Albuquerque
Departamento de Administrao
Universidade de Braslia.
03 de Agosto de 2012
1 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Agenda
1 Introduo ao SVC.
2 Aplicao.
3 Concluso.
2 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
O SVC (Support Vector Clustering) uma metodologia
derivada do SVM (Support Vector Machine) a qual
oriunda do campo de estudo: Aprendizado Estatstico.
O SVC depende dos seguintes componentes :
1 Uma amostra x

i
R
d
com i = 1, . . . , n para um
conjunto de d variveis. Essa amostra denominada
Espao de Dados.
2 Um Espao de Caracterstica H, de dimenso
superior a d, nesse espao, um ponto amostral x

mapeado para um espao de caracterstica por meio


de um mapeamento no-linear , chama-se ento (x

)
a imagem de x

.
3 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
O SVC (Support Vector Clustering) uma metodologia
derivada do SVM (Support Vector Machine) a qual
oriunda do campo de estudo: Aprendizado Estatstico.
O SVC depende dos seguintes componentes :
1 Uma amostra x

i
R
d
com i = 1, . . . , n para um
conjunto de d variveis. Essa amostra denominada
Espao de Dados.
2 Um Espao de Caracterstica H, de dimenso
superior a d, nesse espao, um ponto amostral x

mapeado para um espao de caracterstica por meio


de um mapeamento no-linear , chama-se ento (x

)
a imagem de x

.
3 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
O SVC (Support Vector Clustering) uma metodologia
derivada do SVM (Support Vector Machine) a qual
oriunda do campo de estudo: Aprendizado Estatstico.
O SVC depende dos seguintes componentes :
1 Uma amostra x

i
R
d
com i = 1, . . . , n para um
conjunto de d variveis. Essa amostra denominada
Espao de Dados.
2 Um Espao de Caracterstica H, de dimenso
superior a d, nesse espao, um ponto amostral x

mapeado para um espao de caracterstica por meio


de um mapeamento no-linear , chama-se ento (x

)
a imagem de x

.
3 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Dentre as aplicaes utilizando SVC, pode-se citar:
1 Reconhecimento de escrita. [Chiang and Hao, 2003].
2 Segmentao de clientes e demonstrao da
superioridade do SVC sobre o K-MEANS e SOFM
(Self-organizing feature map) para os dados
estudados. [Huang et al., 2007].
3 Deteco de invaso de redes computacionais.
[Xu and Zhang, 2005].
4 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Dentre as aplicaes utilizando SVC, pode-se citar:
1 Reconhecimento de escrita. [Chiang and Hao, 2003].
2 Segmentao de clientes e demonstrao da
superioridade do SVC sobre o K-MEANS e SOFM
(Self-organizing feature map) para os dados
estudados. [Huang et al., 2007].
3 Deteco de invaso de redes computacionais.
[Xu and Zhang, 2005].
4 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Dentre as aplicaes utilizando SVC, pode-se citar:
1 Reconhecimento de escrita. [Chiang and Hao, 2003].
2 Segmentao de clientes e demonstrao da
superioridade do SVC sobre o K-MEANS e SOFM
(Self-organizing feature map) para os dados
estudados. [Huang et al., 2007].
3 Deteco de invaso de redes computacionais.
[Xu and Zhang, 2005].
4 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
O objetivo do SVC encontrar a menor hiperesfera que
contm os dados em um determinado espao de
caractersticas. Em outras palavras:
Argmin
a

,R
R
2
sujeito a x

i
a

2
R
2
para i = 1, . . . , n.
(1)
5 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
O problema 1 pode ser reescrito na forma:
Argmin
a

,R
R
2
+ C
n

i=1

i
sujeito a x

i
a

2
R
2
+
i
para
i
0 e i = 1, . . . , n.
(2)
onde C um termo de penalizao que controla o trade-off
entre o volume da hiperesfera e a presena de outliers.
Nessa formulao, permite-se que alguns pontos quem
fora da hiperesfera.
9 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Motivado pela facilidade de implementao computacional
o problema 2 pode ser escrito na sua forma Dual,
[Wolfe, 1961]:
Argmin

i=1

i
< x

i
, x

i
>
n

i=1
n

j=1

j
< x

i
, x

j
>
sujeito a

i=1

i
= 1
para 0
i
C e i = 1, . . . , n.
(3)
onde < x

i
, x

j
> representa o produto interno entre os
vetores x

i
e x

j
.
11 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Mas o ideal que os conglomerados sejam formados
segundo alguma geometria arbitrria, nesse caso, faz-se o
mapeamento do vetor de dados x

i
do Espao de Dados
para o Espao de Caractersticas cuja imagem dada por
(x

i
).
Essa no-linearidade da hiperesfera dada pela escolha
de um Kernel que admita uma estrutura no-linear. Em
outras palavras, para n = d = 2 temos x

1
= (x
11
, x
12
) e
x

2
= (x
21
, x
22
):
12 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Mas o ideal que os conglomerados sejam formados
segundo alguma geometria arbitrria, nesse caso, faz-se o
mapeamento do vetor de dados x

i
do Espao de Dados
para o Espao de Caractersticas cuja imagem dada por
(x

i
).
Essa no-linearidade da hiperesfera dada pela escolha
de um Kernel que admita uma estrutura no-linear. Em
outras palavras, para n = d = 2 temos x

1
= (x
11
, x
12
) e
x

2
= (x
21
, x
22
):
12 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x

1
= (x
11
, x
12
) e x

2
= (x
21
, x
22
) tem-se:
Linear: < x

1
..
(x

1
)
, x

2
..
(x

2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x

1
, x

2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,

2x
11
x
12
)
. .
(x

1
)
, (x
2
21
, x
2
22
,

2x
21
x
22
)
. .
(x

2
)
>
Gaussiano: < (x

1
), (x

2
) >=
K
_
(x

1
), (x

2
)
_
= exp
_
x

1
x

2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x

1
= (x
11
, x
12
) e x

2
= (x
21
, x
22
) tem-se:
Linear: < x

1
..
(x

1
)
, x

2
..
(x

2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x

1
, x

2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,

2x
11
x
12
)
. .
(x

1
)
, (x
2
21
, x
2
22
,

2x
21
x
22
)
. .
(x

2
)
>
Gaussiano: < (x

1
), (x

2
) >=
K
_
(x

1
), (x

2
)
_
= exp
_
x

1
x

2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x

1
= (x
11
, x
12
) e x

2
= (x
21
, x
22
) tem-se:
Linear: < x

1
..
(x

1
)
, x

2
..
(x

2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x

1
, x

2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,

2x
11
x
12
)
. .
(x

1
)
, (x
2
21
, x
2
22
,

2x
21
x
22
)
. .
(x

2
)
>
Gaussiano: < (x

1
), (x

2
) >=
K
_
(x

1
), (x

2
)
_
= exp
_
x

1
x

2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x

1
= (x
11
, x
12
) e x

2
= (x
21
, x
22
) tem-se:
Linear: < x

1
..
(x

1
)
, x

2
..
(x

2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x

1
, x

2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,

2x
11
x
12
)
. .
(x

1
)
, (x
2
21
, x
2
22
,

2x
21
x
22
)
. .
(x

2
)
>
Gaussiano: < (x

1
), (x

2
) >=
K
_
(x

1
), (x

2
)
_
= exp
_
x

1
x

2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x

1
= (x
11
, x
12
) e x

2
= (x
21
, x
22
) tem-se:
Linear: < x

1
..
(x

1
)
, x

2
..
(x

2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x

1
, x

2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,

2x
11
x
12
)
. .
(x

1
)
, (x
2
21
, x
2
22
,

2x
21
x
22
)
. .
(x

2
)
>
Gaussiano: < (x

1
), (x

2
) >=
K
_
(x

1
), (x

2
)
_
= exp
_
x

1
x

2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x

1
= (x
11
, x
12
) e x

2
= (x
21
, x
22
) tem-se:
Linear: < x

1
..
(x

1
)
, x

2
..
(x

2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x

1
, x

2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,

2x
11
x
12
)
. .
(x

1
)
, (x
2
21
, x
2
22
,

2x
21
x
22
)
. .
(x

2
)
>
Gaussiano: < (x

1
), (x

2
) >=
K
_
(x

1
), (x

2
)
_
= exp
_
x

1
x

2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x

1
= (x
11
, x
12
) e x

2
= (x
21
, x
22
) tem-se:
Linear: < x

1
..
(x

1
)
, x

2
..
(x

2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x

1
, x

2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,

2x
11
x
12
)
. .
(x

1
)
, (x
2
21
, x
2
22
,

2x
21
x
22
)
. .
(x

2
)
>
Gaussiano: < (x

1
), (x

2
) >=
K
_
(x

1
), (x

2
)
_
= exp
_
x

1
x

2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x

1
= (x
11
, x
12
) e x

2
= (x
21
, x
22
) tem-se:
Linear: < x

1
..
(x

1
)
, x

2
..
(x

2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x

1
, x

2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,

2x
11
x
12
)
. .
(x

1
)
, (x
2
21
, x
2
22
,

2x
21
x
22
)
. .
(x

2
)
>
Gaussiano: < (x

1
), (x

2
) >=
K
_
(x

1
), (x

2
)
_
= exp
_
x

1
x

2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
No caso do Kernel gaussiano, o espao de caractersticas
innito, assuma por simplicidade x R e > 0:
e
x
i
x
j

2
= e
(x
i
x
j
)
2
= e
x
2
i
+2x
i
x
j
x
2
j
=
e
x
2
i
x
2
j
_
1 +
2x
i
x
j
1!
+
(2x
i
x
j
)
2
2!
+
(2x
i
x
j
)
3
3!
+ . . .
_
=
e
x
2
i
x
2
j
_
1 +
_
2
1!
x
i
_
2
1!
x
j
+
_
(2)
2
2!
x
2
i
_
(2)
2
2!
x
2
j
+
+
_
(2)
3
3!
x
3
i
_
(2)
3
3!
x
3
j
+ . . .
_
=< (x
i
), (x
j
) >
onde (x) = e
x
2
_
1,
_
2
1!
x,
_
(2)
2
2!
x
2
,
_
(2)
3
3!
x
3
, . . .
_
14 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
No caso do Kernel gaussiano, o espao de caractersticas
innito, assuma por simplicidade x R e > 0:
e
x
i
x
j

2
= e
(x
i
x
j
)
2
= e
x
2
i
+2x
i
x
j
x
2
j
=
e
x
2
i
x
2
j
_
1 +
2x
i
x
j
1!
+
(2x
i
x
j
)
2
2!
+
(2x
i
x
j
)
3
3!
+ . . .
_
=
e
x
2
i
x
2
j
_
1 +
_
2
1!
x
i
_
2
1!
x
j
+
_
(2)
2
2!
x
2
i
_
(2)
2
2!
x
2
j
+
+
_
(2)
3
3!
x
3
i
_
(2)
3
3!
x
3
j
+ . . .
_
=< (x
i
), (x
j
) >
onde (x) = e
x
2
_
1,
_
2
1!
x,
_
(2)
2
2!
x
2
,
_
(2)
3
3!
x
3
, . . .
_
14 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
No caso do Kernel gaussiano, o espao de caractersticas
innito, assuma por simplicidade x R e > 0:
e
x
i
x
j

2
= e
(x
i
x
j
)
2
= e
x
2
i
+2x
i
x
j
x
2
j
=
e
x
2
i
x
2
j
_
1 +
2x
i
x
j
1!
+
(2x
i
x
j
)
2
2!
+
(2x
i
x
j
)
3
3!
+ . . .
_
=
e
x
2
i
x
2
j
_
1 +
_
2
1!
x
i
_
2
1!
x
j
+
_
(2)
2
2!
x
2
i
_
(2)
2
2!
x
2
j
+
+
_
(2)
3
3!
x
3
i
_
(2)
3
3!
x
3
j
+ . . .
_
=< (x
i
), (x
j
) >
onde (x) = e
x
2
_
1,
_
2
1!
x,
_
(2)
2
2!
x
2
,
_
(2)
3
3!
x
3
, . . .
_
14 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
No caso do Kernel gaussiano, o espao de caractersticas
innito, assuma por simplicidade x R e > 0:
e
x
i
x
j

2
= e
(x
i
x
j
)
2
= e
x
2
i
+2x
i
x
j
x
2
j
=
e
x
2
i
x
2
j
_
1 +
2x
i
x
j
1!
+
(2x
i
x
j
)
2
2!
+
(2x
i
x
j
)
3
3!
+ . . .
_
=
e
x
2
i
x
2
j
_
1 +
_
2
1!
x
i
_
2
1!
x
j
+
_
(2)
2
2!
x
2
i
_
(2)
2
2!
x
2
j
+
+
_
(2)
3
3!
x
3
i
_
(2)
3
3!
x
3
j
+ . . .
_
=< (x
i
), (x
j
) >
onde (x) = e
x
2
_
1,
_
2
1!
x,
_
(2)
2
2!
x
2
,
_
(2)
3
3!
x
3
, . . .
_
14 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
No caso do Kernel gaussiano, o espao de caractersticas
innito, assuma por simplicidade x R e > 0:
e
x
i
x
j

2
= e
(x
i
x
j
)
2
= e
x
2
i
+2x
i
x
j
x
2
j
=
e
x
2
i
x
2
j
_
1 +
2x
i
x
j
1!
+
(2x
i
x
j
)
2
2!
+
(2x
i
x
j
)
3
3!
+ . . .
_
=
e
x
2
i
x
2
j
_
1 +
_
2
1!
x
i
_
2
1!
x
j
+
_
(2)
2
2!
x
2
i
_
(2)
2
2!
x
2
j
+
+
_
(2)
3
3!
x
3
i
_
(2)
3
3!
x
3
j
+ . . .
_
=< (x
i
), (x
j
) >
onde (x) = e
x
2
_
1,
_
2
1!
x,
_
(2)
2
2!
x
2
,
_
(2)
3
3!
x
3
, . . .
_
14 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Ao solucionar o problema de programao matemtica 3
substituindo o produto interno do Espao de Dados
< x

i
, x

j
> por um produto interno de um Espao de
Caracterstica, < (x

i
), (x

j
) > de dimenso superior ao
conjunto de dados possvel mapear conglomerados de
geometria arbitrria.
Mtodos como a anlise de conglomerados hierrquica
tendem a gerar conglomerados frequentemente limitados a
hiperelipsides ([Jain and Dubes, 1988]), enquanto o SVC
permite a formulao de clusters com geometria arbitrria.
15 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Ao solucionar o problema de programao matemtica 3
substituindo o produto interno do Espao de Dados
< x

i
, x

j
> por um produto interno de um Espao de
Caracterstica, < (x

i
), (x

j
) > de dimenso superior ao
conjunto de dados possvel mapear conglomerados de
geometria arbitrria.
Mtodos como a anlise de conglomerados hierrquica
tendem a gerar conglomerados frequentemente limitados a
hiperelipsides ([Jain and Dubes, 1988]), enquanto o SVC
permite a formulao de clusters com geometria arbitrria.
15 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
As solues nesse novo espao seguem uma forma
no-paramtrica para a estimao de densidades do
conjunto de dados originais.
Assim, os conglomerados so gerados pelos conjuntos de
dados onde h maior massa de probabilidade e os vales
entre essas massas representariam a separao entre os
conglomerados.
18 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
As solues nesse novo espao seguem uma forma
no-paramtrica para a estimao de densidades do
conjunto de dados originais.
Assim, os conglomerados so gerados pelos conjuntos de
dados onde h maior massa de probabilidade e os vales
entre essas massas representariam a separao entre os
conglomerados.
18 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
A utilizao do SVC como mecanismo de segmentao da
clientela foi utilizado para o conjunto de dados de uma
pesquisa realizada no Rio de Janeiro entre os dias 08 e
20 de maio de 2008, para um total de 1000
entrevistados.
O objetivo inicial da pesquisa era a identicao do
potencial de consumo da tecnologia de TV mvel na
cidade do Rio de Janeiro, de modo a identicar, controlar e
analisar o conjunto de variveis sobre a pr-disposio dos
potenciais compradores de aparelhos celulares compatveis
com esta tecnologia.
20 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
A utilizao do SVC como mecanismo de segmentao da
clientela foi utilizado para o conjunto de dados de uma
pesquisa realizada no Rio de Janeiro entre os dias 08 e
20 de maio de 2008, para um total de 1000
entrevistados.
O objetivo inicial da pesquisa era a identicao do
potencial de consumo da tecnologia de TV mvel na
cidade do Rio de Janeiro, de modo a identicar, controlar e
analisar o conjunto de variveis sobre a pr-disposio dos
potenciais compradores de aparelhos celulares compatveis
com esta tecnologia.
20 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
Com base nessas informaes, procedeu-se com a anlise
SVC para a elaborao de grupos homogneos
internamente com o intuito de segmentar a clientela,
tratando assim, a heterogeneidade presente no perl
desses consumidores entrevistados.
Para os parmetros do SVC xou-se C = 1 uma vez que
no seria interessante a obteno de pontos do tipo
Bounded Support Vector, mas somente observaes que
estivessem contidas na hiperesfera do espao de
caracterstica ou fossem pontos de suporte vetorial, ou
seja, Support Vectors [Ben-Hur et al., 2002].
21 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
Com base nessas informaes, procedeu-se com a anlise
SVC para a elaborao de grupos homogneos
internamente com o intuito de segmentar a clientela,
tratando assim, a heterogeneidade presente no perl
desses consumidores entrevistados.
Para os parmetros do SVC xou-se C = 1 uma vez que
no seria interessante a obteno de pontos do tipo
Bounded Support Vector, mas somente observaes que
estivessem contidas na hiperesfera do espao de
caracterstica ou fossem pontos de suporte vetorial, ou
seja, Support Vectors [Ben-Hur et al., 2002].
21 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
Usualmente, utiliza-se como valor para C = 1, j para o
valor de , uma proposta comum percorrer diversos
valores de q a partir de:

=
1
max
i,j
_
_
_
_
x

i
x

j
_
_
_
_
2
(4)
onde

representa o valor inicial para , esse valor


aumentado at que se encontre conglomerados que
atendam as exigncias do pesquisador
[Ben-Hur et al., 2002].
22 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
O parmetro do tamanho do kernel foi gradativamente
alterado a partir do valor de

0.00116 apresentado na
equao 4, produzindo assim 20 grupos de
conglomerados com tamanhos que compreendiam desde
apenas 1 conglomerado.
23 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
De maneira a tornar tratvel o problema de segmentao
escolheu-se um valor factvel para o nmeros de clusters,
nesse caso, com = 0.0208 apresentam-se 5
conglomerados, sendo portanto, uma quantia manejvel
de grupos de clientes para a elaborao de polticas de
marketing gerencial.
24 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
Uma forma de avaliar a qualidade do mtodo SVC sobre os
algoritmos de anlise de conglomerados tradicionais,
medir a soma total dos quadrados das observaes para
cada um dos agrupamentos como denido em 5:
STQ =
S

s=1
N
(s)

i=1
_
_
_
_
x

(s)
i
x
(s)
_
_
_
_
2
(5)
onde s = 1, . . . , 5 representam os possveis conglomerados
e N
(s)
representa o nmero de observaes no cluster s, x

(s)
i
e x
(s)
representam respectivamente a i-sima observao
do cluster s e a mdia das observaes no s-simo
aglomerado.
25 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
Table: Razo da soma total de quadrados entre os diversos
mtodos de anlise conglomerados.
N/D SVC W. S. Co. A. Mc. M. Ce.
SVC 1 0.93 1.00 0.97 0.98 0.96 0.99 1.00
W. - 1 1.06 1.03 1.05 1.03 1.06 1.07
S. - - 1 0.97 0.98 0.96 0.99 1.00
Co. - - - 1 1.01 0.99 1.02 1.03
A. - - - - 1 0.97 1.00 1.01
Mc. - - - - - 1 1.03 1.03
M. - - - - - - 1 1.00
Ce. - - - - - - - 1
26 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Concluso.
Na aplicao realizada, o SVC mostrou-se competitivo em
relao aos mtodos clssicos de anlise de
conglomerados hierrquicos.
H muito ainda em se desenvolver tanto teoricamente como
empiricamente.
H poucas propostas para determinao dos parmetros de
suavizao (bandwidth ) e o parmetro de penalizao.
Os recentes textos comprovam a superioridade do mtodo
Support Vector Clustering sobre os demais mtodos de
anlise de conglomerados apesar das diculdades
computacionais para a sua implementao.
27 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Concluso.
Na aplicao realizada, o SVC mostrou-se competitivo em
relao aos mtodos clssicos de anlise de
conglomerados hierrquicos.
H muito ainda em se desenvolver tanto teoricamente como
empiricamente.
H poucas propostas para determinao dos parmetros de
suavizao (bandwidth ) e o parmetro de penalizao.
Os recentes textos comprovam a superioridade do mtodo
Support Vector Clustering sobre os demais mtodos de
anlise de conglomerados apesar das diculdades
computacionais para a sua implementao.
27 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Concluso.
Na aplicao realizada, o SVC mostrou-se competitivo em
relao aos mtodos clssicos de anlise de
conglomerados hierrquicos.
H muito ainda em se desenvolver tanto teoricamente como
empiricamente.
H poucas propostas para determinao dos parmetros de
suavizao (bandwidth ) e o parmetro de penalizao.
Os recentes textos comprovam a superioridade do mtodo
Support Vector Clustering sobre os demais mtodos de
anlise de conglomerados apesar das diculdades
computacionais para a sua implementao.
27 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Concluso.
Na aplicao realizada, o SVC mostrou-se competitivo em
relao aos mtodos clssicos de anlise de
conglomerados hierrquicos.
H muito ainda em se desenvolver tanto teoricamente como
empiricamente.
H poucas propostas para determinao dos parmetros de
suavizao (bandwidth ) e o parmetro de penalizao.
Os recentes textos comprovam a superioridade do mtodo
Support Vector Clustering sobre os demais mtodos de
anlise de conglomerados apesar das diculdades
computacionais para a sua implementao.
27 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Agradecimentos.
Essa apresentao foi nanciada pelo Decanato de
Pesquisa e Ps-graduao da Universidade de Braslia.
http://www.unb.br/administracao/decanatos/dpp/
28 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Bibliograa I
Ben-Hur, A., Horn, D., Siegelmann, H. T., and Vapnik, V.
(2002).
Support vector clustering.
J. Mach. Learn. Res., 2:125137.
Chiang, J.-H. and Hao, P.-Y. (2003).
A new kernel-based fuzzy clustering approach: support
vector clustering with cell growing.
Fuzzy Systems, IEEE Transactions on, 11(4):518 527.
Huang, J.-J., Tzeng, G.-H., and Ong, C.-S. (2007).
Marketing segmentation using support vector clustering.
Expert Systems with Applications, 32(2):313 317.
29 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Bibliograa II
Jain, A. K. and Dubes, R. C. (1988).
Algorithms for clustering data.
Prentice-Hall, Inc., Upper Saddle River, NJ, USA.
Wolfe, P. (1961).
A Duality Theorem for Nonlinear Programming.
Quarterly of Applied Mathematics, 19:239244.
Xu, B. and Zhang, A. (2005).
Application of support vector clustering algorithm to
network intrusion detection.
In Neural Networks and Brain, 2005. ICNN B 05.
International Conference on, volume 2, pages 1036
1040.
30 / 30

Potrebbero piacerti anche