Sei sulla pagina 1di 2

www.datascienceacademy.com.

br



Big Data Analytics com R e Microsoft Azure
Machine Learning


Bonus

K-Means Clustering em R



Big Data Analytics com R e Microsoft Azure Machine Learning


K-Means Clustering é um algoritmo de aprendizagem supervisionada que tentar criar grupos
(clusters) de dados baseado em suas similaridades. Ele é um algoritmo não supervisionado, pois
não há um resultado, o qual o algoritmo possa criar para aprender a criar um modelo de
preditivo. O algoritmo tenta descobrir os padrões nos dados e a partir daí gerar um modelo que
possa fazer as previsões. Na Clusterização com K-Means, nós temos que especificar o número
de clusters que os dados devem ser agrupados. Randomicamente, o algoritmo atribui cada
observação para um cluster e encontra os valores centrais de cada cluster.

O K-Means Clustering é usado para agrupar documentos similares, agrupar clientes baseado em
seus atributos, segmentação de Marketing e identificação de grupos fisicamente similares.

O principal objeto é dividir os dados em grupos distintos, considerando observações dentro de
cada grupo por similaridade.

Um dos maiores desafios deste algoritmo é encontra o valor adequado de K






Equipe Data Science Academy

Data Science Academy 2


www.datascienceacademy.com.br

Potrebbero piacerti anche