Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
br
Big Data Analytics com R e Microsoft Azure
Machine Learning
Bonus
K-Means Clustering em R
Big Data Analytics com R e Microsoft Azure Machine Learning
K-Means Clustering é um algoritmo de aprendizagem supervisionada que tentar criar grupos
(clusters) de dados baseado em suas similaridades. Ele é um algoritmo não supervisionado, pois
não há um resultado, o qual o algoritmo possa criar para aprender a criar um modelo de
preditivo. O algoritmo tenta descobrir os padrões nos dados e a partir daí gerar um modelo que
possa fazer as previsões. Na Clusterização com K-Means, nós temos que especificar o número
de clusters que os dados devem ser agrupados. Randomicamente, o algoritmo atribui cada
observação para um cluster e encontra os valores centrais de cada cluster.
O K-Means Clustering é usado para agrupar documentos similares, agrupar clientes baseado em
seus atributos, segmentação de Marketing e identificação de grupos fisicamente similares.
O principal objeto é dividir os dados em grupos distintos, considerando observações dentro de
cada grupo por similaridade.
Um dos maiores desafios deste algoritmo é encontra o valor adequado de K
Equipe Data Science Academy