Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Cluster
Cluster: Un punto usado para representar un
Concepto
Algoritmos de agrupamiento: Tienen como
objetivo devolver al usuario una serie de
puntos que en cierto modo representan al
resto de puntos iniciales por su posicin
privilegiada con respecto al total.
Aplicaciones
Aprendizaje no supervisado: No requieren del uso
del error entre la salida del sistema y el modelo
que se pretende obtener para adaptar los
parmetros
Algoritmos de agrupamiento
ms utilizados
K-means clustering
Fuzzy c-means clustering
Grupos prximos a un entorno (nearest
neighborhood clustering)
Redes de aprendizaje competitivo
Mapas autoorganizados
entrada
Matriz nxN:
n=2 y N=9
Matriz de distancias
Matriz de distancias: Se almacena la distancia
d2,7
d1,3
Matriz cxN:
c=2 y N=9
d2,9
2 4
V
2.3 2
Matriz de pertenencias
Se define la pertenencia a uno u otro grupo
c: Nmero de clusters
N: nmero de puntos de entrada
Matriz de distancias
D =[ 0 0.5000 1.0000 1.1180 2.0616 3.0414 4.0000 4.0311 4.1231
4.1231 4.0311 4.0000 3.0414 2.0616 1.1180 1.0000 0.5000
0]
Matriz de pertenencias
U =[1
0
1
0
1
0
1
0
1
0
0
1
0
1
0
1
0
1]
Grupo 1
Grupo 2
Algoritmo
Condiciones iniciales:
c = Nmero de clusters
z = [ ] Matriz de datos
v = [ ] Valores iniciales de los clusters
Desde l=1 hasta criterio de mnima distancia
{
Se calcula la matriz de distancias U (utiliza matrices z y v)
Se calcula la matriz de pertenencias (utiliza la matriz U)
Se calcula la matriz de centroides o clusters (utiliza la
matriz z y U)
}
Ejemplo
Condiciones
iniciales
Primera iteracin
Segunda iteracin
kmeans (Matlab)
Matlab posee un toolbox de estadstica que realiza el
algoritmo de k-means clustering. La sintaxis es:
[...] = kmeans(...,'param1',val1,'param2',val2,...)
donde, entre otras, devuelve:
a) La matriz de pertenencia
b) La matriz de centroides
c) La matriz de distancias.
kmeans (II)
Parmetros de entrada:
Criterio para medir la distancia entre la matriz de datos y
los centroides (la medida implcita es la norma
eucldea).
La forma en que se establecen las condiciones iniciales
de los centroides (de forma predeterminada escoge
como valores iniciales de los centroides a valores de la
matriz de datos).
Nmero de iteraciones en la bsqueda de los centroides
(el valor implcito es 100).