Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Nel data mining e nel machine learning, il clustering è una delle tecniche più
importanti di raggruppamento di oggetti.
Ad ogni arco è associato un costo pari alla distanza euclidea tra i due nodi
stessa classe.
Clustering
Il centroide può
essere reale ovvero
coincidere con uno
degli oggetti del
cluster
min d
i , jV
x
ij ij
Minimizza la somma delle distanze di
ogni nodo dal suo centroide
y
jV
j p Fissa il numero di centroidi (cluster)
x
jV
ij 1 i V Ogni elemento deve afferire ad un centroide
y j 0,1 j V
P-median problem
Algoritmo di Teitz e Bart
L’algoritmo di Teitz e Bart è un algoritmo migliorativo basato sul concetto di saving
dovuto alla sostituzione di un centro aperto con un altro.
Sia S l’insieme dei p centri aperti ed S’ l’insieme dei centri non aperti
Osservazione
Se un nodo j є S’ non genera alcun saving, anche nelle successive iterazioni non
potrà generare saving e quindi può non essere considerato
P-median problem
Algoritmo di Teitz e Bart, esempio
𝑃=3
Inizializzazione:
𝑆={1,2,3
} 𝑧 ( 𝑆 ) =𝑐 4,1 +𝑐 5,1 +𝑐 5,2=12
𝑃=3
𝑆={2,3,4
} 𝑧 ( 𝑆 ) =𝑐 1,4 +𝑐 5,4 + 𝑐6,2 =10
𝑃=3
𝑆={2,4,6
} 𝑧 ( 𝑆 ) =𝑐 1,4 +𝑐 3,4 + 𝑐5,4 =9