Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
a.a. 2016/2017
Roberta Pappadà
Trieste, 3 maggio 2017
Indice
5. Valutazione di un raggruppamento
1
Metodi gerarchici
Metodi gerarchici e non clustering
Partitional
Partitional clustering
Hierarchical
Introduzione 3
Metodi gerarchici agglomerativi
Algoritmi agglomerativi 4
Struttura di raggruppamento: il dendrogramma
• Le successive partizioni
individuate da un
dendrogramma sono
nidificate;
• le unità sono sull’asse
orizzontale, mentre l’altezza
del segmento che unisce due
unità corrisponde alla distanza
tra esse
Algoritmi agglomerativi 5
Distanze tra gruppi (I)
1 P
dove x̄l = [x̄1,l , . . . , x̄p,l ]T e x̄j,l = nl xi 2Cl xij .
Algoritmi agglomerativi 7
Criterio del legame singolo
4
●
2 3
● ●
● 5
1
●
Algoritmi agglomerativi 8
Criterio del legame completo
4
●
2 3
● ●
● 5
1
●
Algoritmi agglomerativi 9
Criterio della distanza media
4
●
2 3
● ●
● 5
●
1
Algoritmi agglomerativi 10
Criterio del centroide
4
●
2 3 x2
● ●
x1 ● 5
1
●
1 2 3 4 5
1 0
2 9 0
3 3 7 0
4 6 5 9 0
5 11 10 2 8 0
Algoritmi agglomerativi 12
Distanze tra gruppi: Esempio
1 2 3 4 5
1 0
2 9 0
3 3 7 0
4 6 5 9 0
5 11 10 2 8 0
Algoritmi agglomerativi 12
Distanze tra gruppi: Esempio
(3,5) 1 2 4
(3,5) 0
1 3 0
2 7 9 0
4 8 6 5 0
Algoritmi agglomerativi 13
Distanze tra gruppi: Esempio
(3,5) 1 2 4
(3,5) 0
1 3 0
2 7 9 0
4 8 6 5 0
Algoritmi agglomerativi 13
Distanze tra gruppi: Esempio
(3,5) 1 2 4
(3,5) 0
1 3 0
2 7 9 0
4 8 6 5 0
Algoritmi agglomerativi 13
Distanze tra gruppi: Esempio
La nuova matrice è
(1,3,5) 2 4
(1,3,5) 0
2 7 0
4 6 5 0
Algoritmi agglomerativi 14
Distanze tra gruppi: Esempio
La nuova matrice è
(1,3,5) 2 4
(1,3,5) 0
2 7 0
4 6 5 0
Algoritmi agglomerativi 14
Distanze tra gruppi: Esempio
La nuova matrice è
(1,3,5) 2 4
(1,3,5) 0
2 7 0
4 6 5 0
Si fondono i gruppi 2 e 4.
Infine, fondendo i gruppi (1, 3, 5) e (2, 4) si ottiene un gruppo che
contiene tutte le unità iniziali.
Algoritmi agglomerativi 14
Distanze tra gruppi: Esempio
6
5
4
d
3
2
1
0
4
unità
Algoritmi agglomerativi 15
Distanze tra gruppi: Esempio
6
5
4
d
3
2
1
0
4
unità
Algoritmi agglomerativi 15
Distanze tra gruppi: Esempio
6
5
4
d
3
2
1
0
4
unità
Algoritmi agglomerativi 15
Distanze tra gruppi: osservazioni (I)
●
1.5
1.5
●●●● ●●
●●●●
● ●●●
● ●●● ●
●●●●●
● ●
●●
●●●● ●
●● ● ●
● ●●● ●●
●●●●●
● ●●
●●●●●
●●
● ●● ●●●● ●● ●
● ●
●●● ● ●
●●● ● ●
● ●
●●
● ●● ●
● ●● ● ●
●●●
● ●● ● ●
● ● ●●
●
●
●● ● ●
● ● ● ●●
●● ● ●●●
●●●● ●
● ●● ● ●●●●
● ● ●● ●●●
1.0
1.0
1.0
●●●●●●●●●● ●●
●●● ●●
●●
● ● ●
●
●● ●
●●● ●● ● ●● ●
● ●●●●● ●●●●●
●
●● ● ● ●
● ● ●●
●
●●● ●●
●
● ●●
●● ● ●● ● ● ●●●● ● ● ● ●
● ●●●● ● ●● ●
●● ●
● ●
● ● ●●
●
0.5
0.5
0.5
●●
●● ● ● ● ●
● ● ●●
●● ●● ● ●●● ●● ●
● ●
● ●● ●● ●
●●● ● ● ●
● ●● ●● ●● ●● ●
●● ●
●
● ● ●
● ● ● ●● ●● ● ●● ●●● ●
● ● ● ●
● ●●● ●●●● ● ●
● ●● ● ●●
● ● ● ● ●● ● ● ●● ● ● ● ●●● ●
●
● ●● ●●
● ● ● ● ●● ● ●
● ●● ● ● ● ●● ●
● ●●
● ● ●●
●
●●
● ● ● ● ●
●● ●●
●●
●
●● ● ● ● ●
●
●●
●●
●
●● ●●
● ●● ● ●●
●
0.0
0.0
0.0
●
●● ●●
● ●● ●●
● ●●
●
● ●●
● ●● ●● ● ●
● ●● ● ●
●●
● ●● ●
● ●●
●● ●
●● ●
● ●● ● ● ●
● ● ●● ● ● ● ●● ● ● ●● ●
● ●● ● ●● ●●● ●●
● ●
●●● ●●●
●● ● ●
● ●● ● ● ●● ●● ●● ●●
● ●
●●● ●● ●
●● ●● ● ● ●●
●
●●
●●● ● ● ● ●
●●
●●● ● ● ● ●
●●● ● ● ●● ●● ● ● ●● ●● ● ●●●
●
−0.5
●●
−0.5
●● ●
●
−0.5 ●
● ● ●
● ● ●●●
● ●● ● ●
●●● ●● ●●
● ●
●
●●●●
●
●
●●● ● ●
● ●●
●
●●●●
●
●●●●
● ●
●●●● ● ●●●●●
●●●
● ●●●
● ● ●
● ● ●●●
●● ● ●●
●●●
●●● ●●
● ●
●● ●● ●●● ●
●●● ●●● ●●● ●● ● ●●●
●● ● ●●●●●●● ●● ●●
●●●
● ●●
● ●●
●
● ● ●● ●●● ●● ●● ●● ● ● ●● ●● ● ● ●
●
●●● ●
● ● ●
● ● ●●● ● ●
●●● ● ● ● ●●
●● ●
● ●
●
Algoritmi agglomerativi 16
Distanze tra gruppi: osservazioni (II)
Scelta la regola per definire la distanza tra due gruppi, nei metodi
visti fin’ora il criterio agglomerativo è sempre lo stesso: si uniscono
i due gruppi che presentano minore distanza tra loro. Il metodo di
Ward o della minima devianza segue un approccio di↵erente.
Algoritmi agglomerativi 17
Metodo di Ward (I)
Algoritmi agglomerativi 18
Metodo di Ward (II)
Algoritmi divisivi 21
Osservazioni generali sui metodi gerarchici (I)
Vantaggi
Algoritmi divisivi 22
Osservazioni generali sui metodi gerarchici (II)
Svantaggi
Algoritmi divisivi 23
Metodi non gerarchici
Metodo delle k-medie: Introduzione
i xi1 xi2
10
1 0.8 2.4
2 2.0 4.0 ●
8
3 7.8 6.0 ●
4 4.4 2.0
6
●
x2
5 6.0 1.0
6 9.1 8.2
4
● ●
7 0.6 1.0 ●
2
8 6.8 6.6
●
● ●
9 4.8 4.0
0
0 2 4 6 8 10
x1
Metodo delle k-medie 26
Metodo delle k-medie: Esempio
10
8 0
0
6
1
x2
1
4
1
2
1 1
0
0 2 4 6 8 10
x1
Per la prima unità (0.8, 2.4) le distanze euclidee dai centroidi sono:
q
(1)
d1,0 = (0.8 5.6)2 + (2.4 5.2)2 ⇡ 5.54
q
(1)
d1,1 = (0.8 4)2 + (2.4 2.9)2 ⇡ 3.24
Metodo delle k-medie 29
Metodo delle k-medie: Esempio
10
0 0
8
8
0 0
6
6
1 1
● ●
x2
x2
1 1
4
4
0 0
● ●
1 1
2
2
0 0
1 1 1 1
0
0 2 4 6 8 10 0 0 2 4 6 8 10
x1 x1
10
i xi1 xi2 gi di,0 di,1 gi
1 0.8 2.4 1 5.54 3.24 1 0
8
2 2.0 4.0 0 3.77 2.29 1
3 7.8 6.0 1 2.36 4.90 0 0
●
6
0
x2
5 6.0 1.0 1 4.22 2.75 1 0
4
1
10
0
8
●
6 0
0
x2
1
4
1 ●
2
1 1
0
0 2 4 6 8 10
x1
(0) (1) (1) (1) (2) (2) (2) (3) (3) (3)
i xi1 xi2 gi di,0 di,1 gi di,0 di,1 gi di,0 di,1 gi
Vantaggi:
Svantaggi: