Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
02 (2018) : SEPTEMBER P a g e | 20
Mesri Silalahi
Universitas Putera Batam,Indonesia.
INFORMASI ARTIKEL A B S T R A C T
Diterima Redaksi: 1 September 2018 PT Batamas Niaga Jaya was established in 1994 located in Sagulung
Diterbitkan Online: 30 September Mas Indah complex, Sagulung Batu Aji district, Batam. This PT rents
2018 out 24 kiosks and 48 counters, in the retail sector, PT has 4 stores,
namely BIG supermarket, Department store, Stationary and 7,500
convenience store and 10,000 department stores. 7,500 Convenience
KATA KUNCI Stores and 10,000 Stores PT Batamas Niaga Jaya sells various
products including food, beverages, kitchen utensils and equipment,
Penjualan, Data Mining, K-Means, and various daily necessities. Sales transactions for 7,500
Rapidminer convenience stores and 10,000 convenience stores were used as
objects for analysis. PT Batamas Niaga Jaya often has problems in
KORESPONDENSI product management, the company is unable to classify the best-
selling products and is not in demand, so it often lacks selling
E-mail: mesripb@gmail.com products and piles of non-salable products. The data used is sales
data for the last 3 months (February 2018-April 2018). The data
cluster technique uses the K-Means algorithm where the data are
grouped into several clusters based on the similarity of the data. The
results of the study obtained 2 product groups, namely products that
were not in demand with the C0 group and the best-selling product
group with the C1 group. The C0 product group that is not in demand
consists of 657 products and the C1 group consists of 70 products
which are in demand.
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 21
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 22
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 23
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 24
Data Mining sangat perlu model keteraturan atau tren untuk objek
dilakukan terutama dalam mengelola data yang perilakunya berubah dari waktu ke
yang sangat besar untuk memudahkan waktu [9].
aktivitas recording atau perekaman suatu
transaksi dan untuk proses Data Clustering
Warehousing agar dapat memberikan Data mentah yang sangat besar
informasi yang akurat bagi pengguna sulit untuk dianalisis dan dipahami, oleh
Data Mining [7]. karenaitu perlu adanya pengelompokan/
Dalam jurnal [8], Tugas data clustering. Dalam hal ini pengelompokan
mining adalah Deskriptif (menemukan bertujuan untuk meningkatkan
pola data) dan prediktif (meramalkan pemahaman terhadap data, untuk menilai
perilaku data yang tersedia berdasarkan kualitas dari data tersebut. K-means
model). Data mining melakukan eksekusi algoritma clustering merupakan adalah
berdasarkan teknik komputasi dan alat pengelompokan yang paling populer
metode dari pembelajaran mesin statistik digunakan dalam aplikasi ilmiah dan
dan pengenalan pola. Teknik data mining industri. K mewakili masing-masing
menavigasi sejumlah besar database dan cluster k oleh mean (atau rata-rata
mengekstrak sejumlah data yang akan tertimbang) dari poin-nya, yang disebut
diterjemahkan dan ditulis menjadi massa. Pusat massa dari cluster adalah
informasi yang berguna sesuai titik koordinat rata-rata dari koordinat
kebutuhan. Proses data mining dapat semua titik dalam cluster [10].
dicirikan sebagai proses berulang multi- Clustering merupakan salah satu
tahap yang melibatkan seleksi data, teknik dari salah satu fungsionalitas data
pembersihan data, penerapan algoritma mining, algoritma cluster ing merupakan
data mining dan evaluasi. algoritma pengelompokkan sejumlah data
Fungsi data mining meliputi menjadi kelompok–kelompok data
klasifikasi, clustering, analisis asosiasi, tertentu (cluster ). Objek data yang
analisis time series, dan analisis outlier. terletak di dalam satu cluster harus
(i) Klasifikasi adalah proses menemukan mempunyai kemiripan. Sedangkan yang
satu set model atau fungsi yang tidak berada didalam satu cluster tidak
menjelaskan dan membedakan kelas data mempunyai kemiripan. Setiap cluster
atau konsep, untuk tujuan memprediksi memiliki centroid yang merupakan suatu
kelas dari objek yang tidak diketahui. (ii) besaran yang dihitung dari rata-rata nilai
Clustering, analisis objek data tanpa tiap items dari suatu cluster dan juga
model kelas diketahui. (iii) analisis memiliki medoid yang merupakan item
Asosiasi adalah penemuan aturan asosiasi yang letaknya paling tengah. Sementara
menampilkan kondisi atribut-nilai yang jarak antar cluster didefinisikan dengan
fre- quently terjadi bersama-sama dalam menggunakan beberapa metode-metode
suatu himpunan data. (iv) analisis time untuk menentukan cluster mana yang
series terdiri dari metode dan memakai berdekatan.
teknik untuk menganalisis data time 1. Single link: jarak terkecil antara satu
series untuk mengekstrak statistik elemen dalam suatu cluster dengan
bermakna dan karakteristik lain dari data. elemen dalam suatu cluster dengan
(v) analisis outlier menjelaskan dan
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 25
elemen lain di cluster yang kelompok yang lain. Proses cluster ing
berbeda. dimulai dengan mengidentifikasi data
2. Complete link: jarak terbesar antara yang akan dicluster ,
satu elemen dalam suatu cluster 𝑥𝑥𝑖𝑖𝑖𝑖(𝑖𝑖=1,…,𝑛𝑛;𝑗𝑗=1,…,𝑚𝑚) dengan n adalah
dengan elemen lain dicluster yang jumlah data yang akan dikluster dan m
berbeda. adalah jumlah variabel. Pada awal iterasi,
3. Average: jarak rata-rata antara satu pusat setiap kluster ditetapkan secara
elemen dalam suatu cluster dengan bebas (sembarang), (𝑘𝑘=1,…,;=1,…,𝑚𝑚).
elemen lain di cluster yang Kemudian dihitung jarak antara setiap
berbeda. data dengan setiap pusat cluster .
4. Centroid: jarak antara centroid dari Algoritma dasar dalam k-means
tiap cluster dengan centroidcluster adalah:
lainnya 1. Tentukan jumlah kluster (k),
5. Medoid: jarak antara medoid dari tetapkan pusat kluster sembarang.
tiap cluster dengan medoidcluster 2. Hitung jarak setiap data ke pusat
lainnya. kluster menggunakan persamaan:
Clustering memiliki banyak
algoritma dengan beberapa kategori yaitu
hierarchical yang menentukan sendiri 3. Kelompokkan data ke dalam kluster
jumlah cluster yang dihasilkan misalnya yang dengan jarak yang paling
algoritma SNN, COBWEB, Chandeon pendek menggunakan persamaan
dan Rock. Partitional yang
mengelompokkan data kedalam k cluster
dimana k adalah banyak cluster dari 4. Hitung pusat kluster yang baru
input user misalnya algoritma CLARA, menggunakan persamaan
K-Means, EM dan Bond Energy.
Sertacluster ing large data yang memiliki
volume data paling besar misalnya
algoritma BIRCH, DBScan dan Cactus Langkah 2 sampai dengan 4 akan
[11]. diulangi sehingga tidak ada lagi data
yang berpindah ke kluster yang lain.
Algoritma K-means Prinsip utama pengelompokkan dengan
K-means [12] merupakan salah Kmeans adalah meminimumkan nilai
satu metode data cluster ing non-hirarki jarak elemen-elemen dengan titik
yang berusaha mempartisi data yang ada pusat(centroid) dalam cluster [13].
ke dalam bentuk satu atau lebih cluster i
kelompok. Metode ini mempartisi ke Rapidminer
dalam cluster i kelompok sehingga data RapidMiner merupaan
yang memiliki karakteristik yang sama software/perangkat lunak untuk
(high intra-class similarity) pengolahan data, dengan menggunakan
dikelompokkan ke dalam satu cluster prinsip dan algoritma data mining,
yang sama dan yang memiliki Rapidminer mengekstrak pola-pola dari
karakteristik yang berbeda (low Inter- data set yang besar dengan
class similarity) dikelompokkan pada
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 26
Kerangka Pemikiran
Perumusan Masalah
Gambar 3. Desain Penelitian
Penentuan Tujuan
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 27
3. Menentukan objek berdasarkan usaha retail Toko Serba 7.500 dan Toko
jarak minimum Serba 10.000 mulai dari bulan Februari
Setelah nilai centroid awal 2018-April 2018 yang dikelompokkan
ditentukan maka dihitung jarak menjadi 75 kategori seperti tabel 1 di
setiap data yang ada terhadap bawah.
terhadap masing-masing centroid Tabel 1. Data Set Penjualan Barang
menggunakan rumus Euclidian Berdasarkan Kategori Produk
seperti yang dijelaskan pada bab 2. Jumlah Jumlah Penjualan (Unit)
No Kategori Item
Setelah jarak setiap data terhadap (Jenis) Februari Maret April
centroid diperoleh maka selanjutnya 1 Baskom 5 119 63 68
data dikelompokkan berdasarkan 2 Bola 6 0 0 73
jarak minimum kemudian 3 Baterai 6 82 48 0
klasifikasikan data berdasarkan 4 Botol 4 108 64 31
kedekatannya dengan centroid. 5 Box 2 18 8 2
4. Menentukan centroid baru 6 Cermin 1 106 9 0
Apabila nilai centroid masih Clean
7 8 69 71 16
Duster
berubah maka tahapan diulang 8 Corong 5 10 10 11
dengan menentukan centroid baru 9 Cutter 107 57 77 392
sampai centroid tidak berubah atau 10 Cleaner Wc 3 21 14 15
stabil. 11 Food 1 35 32 0
12 Gantungan 9 79 47 71
Lokasi Penelitian 13 Garpu 4 12 10 25
PT Batamas Niaga Jaya. 14 Gayung 5 76 76 57
Perusahaan ini telah berdiri sejak tahun 15 Gelas 36 356 154 183
1994 terletak di komplek Sagulung Mas 16 Handuk 1 0 0 6
Indah kecamatan Sagulung Batu Aji 17 Hanger 7 137 98 131
Batam. Selain retail, PT Batamas Niaga 18 Hook 9 57 55 57
Jaya juga menyewakan kios counter. PT 19 Kain 5 167 71 122
ini menyewakan 24 kios dan 48 counter, 20 Kemoceng 1 29 12 21
sedangkan di bidang retail PT ini 21 Keranjang 26 362 181 59
memiliki 4 toko retail yaitu BIG 22 Kran 3 27 11 5
supermarket, Departement store, 23 Lap 2 4 2 9
Stationary serta Toko Serba 7.500 dan 24 Lem 5 0 0 38
Toko serba 10.000. Khusus di bidang 25 Mainan 57 2,271 1,322 1,291
retail, PT Batamas Niaga Jaya menjual 26 Mangkok 14 142 54 61
berbagai macam produk diantaranya 27 Nampan 8 289 69 92
produk-produk makanan, minuman,
28 Obeng 4 14 16 22
peralatan dan perlengkapan dapur, dan
29 Parutan 3 37 22 23
masih banyak lagi produk yang dijual 30 Payung 1 9 8 12
untuk kebutuhan sehari-hari.
Analisis Data Model
Analisis Data
Sesuai dengan dataset yang
Data yang digunakan untuk
sudah dikelompokkan berdasarkan
penelitian ini berupa data set penjualan
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 28
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 29
cluster : = 166,4752233
C(0) = √(0-154)2+(0-8)2+(1-40)2 Dari hasil perhitungan di atas diperoleh
= √23.716 +64+1.521 bahwa jarak data penjualan ke-4 dengan
=
√25.301 pusat cluster pertama (C0) adalah
= 159,0628806 159,0628806 serta serta dengan pusat
C(1) = √(0-133)2+(0-56)2+(1-84)2 cluster kedua (C1) adalah 166,4752233.
= √17.689 +3.136+6.889 Oleh karena itu jarak yang paling dekat
= √27.714 (jarak terpendek) dengan pusat cluster
= 166,4752233 adalah 159,0628806.
Dari hasil perhitungan di atas Jarak data data penjualan ke-5 ke pusat
diperoleh bahwa jarak data penjualan ke- cluster :
2 dengan pusat cluster pertama (C0) C(0) = √(0-154)2+(0-8)2+(30-40)2
adalah 159,0628806 serta dengan pusat = √23.716 +64+100
cluster kedua (C1) adalah 166,4752233. =
√23.880
Oleh karena itu jarak yang paling dekat = 154,5315501
(jarak terpendek) dengan pusat cluster C(1) = √(0-133)2+(0-56)2+(30-84)2
adalah 159,0628806. = √17.689 +3.136+2.916
Jarak data data penjualan ke-3 ke pusat =
√23.741
cluster : = 154,0811474
C(0) = √(0-154)2+(0-8)2+(1-40)2 Dari hasil perhitungan di atas diperoleh
= √23.716 +64+1.521 bahwa jarak data penjualan ke-5 dengan
=
√25.301 pusat cluster pertama (C0) adalah
= 159,0628806 154,5315501 serta dengan pusat cluster
C(1) = √(0-133)2+(0-56)2+(1-84)2 kedua (C1) adalah 154,0811474. Oleh
= √17.689 +3.136+6.889 karena itu jarak yang paling dekat (jarak
=
√27.714 terpendek) dengan pusat cluster adalah
= 166,4752233 154,0811474.
Dari hasil perhitungan di atas diperoleh Demikian juga dengan data
bahwa jarak data penjualan ke-3 dengan penjualan yang lainnya dilakukan
pusat cluster pertama (C0) adalah perhitungan dengan cara yang sama.
159,0628806 serta dengan pusat cluster Dalam penelitian ini untuk
kedua (C1) adalah 166,4752233. Oleh perhitungannya menggunakan Microsoft
karena itu jarak yang paling dekat (jarak excel. Hasil perhitungan dan penentuan
terpendek) dengan pusat cluster adalah jarak terpendek dapat dilihat pada tabel di
159,0628806. bawah.
Jarak data data penjualan ke-4 ke pusat
cluster :
C(0) = √(0-154)2+(0-8)2+(1-40)2
= √23.716 +64+1.521
=
√25.301
= 159,0628806
C(1) = √(0-133)2+(0-56)2+(1-84)2
= √17.689 +3.136+6.889
=
√27.714
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 30
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 31
1
dihitung sesuai dengan rumus yang sudah
energizer e92
dijelaskan pada bab 2 dan yang dihitung 18 aaa bp2+1max 16 7 0
8.72249
96
39.7440
23
8.72249
96
2
sebagai berikut: 19
1199 bola
sport
0 0 6
10.3610
82
49.2546
58
10.3610
82
C0 (fe) = 6.360/674 = 9.43620178 20
7788 bola
smiley
0 0 2
10.7374
43
50.8662
94
10.7374
43
28.11320755 9 1 0
Cluster 1 36.13207547 24.16981132
10 0 1
11 1 0
Dikarenakan pusat cluster yang baru 12 1 0
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 32
0029 alas
7.4924 7 1 0
1 panas 0 0 4 7.5 67
05
motif
3273 alas
8.2519 8 0 1
2 panas 0 0 1 8.3 68
72
motif
393#15*1 9 1 0
5 alas 8.2519
3 0 0 1 8.3 68
panas 72 10 0 1
persegi
539 alas
4 panas 0 0 1 8.3 68
8.2519 11 1 0
72
circle
5 alas kaki 0 0 30 27 64
26.579 12 1 0
92
2's 13 1 0
qiangshun 8.7224
6 0 0 0 8.7 69
perekat 62
tikus 14 1 0
items
7.2292
7 fresh non 1 0 2 7.2 67
78 15 1 0
barcode
02
8 shunfeng 58 31 29 64 13
13.235 16 1 0
03
baskom
057 centa 4.7769 17 1 0
9 7 5 9 4.8 58
t.sendok 81
6884- 26.432 18 1 0
10 36 16 17 35 26
baskom 02
802 ke
5.0884 19 1 0
11 wei 7 1 2 5.1 61
77
baskom
20 1 0
8032 8.7679
12 11 7 11 8.8 53
baskom 75
3s
eveready 6.5764
13
s91 bp20
3 1 0 6.6 66
95 Implementasi dengan Rapidminer
sil 3
3s Pengolahan data menggunakan
eveready 8.1384
14 1 0 0 8.1 68
s92 bp20 93 rapidminer seperti ditampilkan pada
sil 4
4's gambar di bawah:
eveready
12.120
15 1012 16 9 0 12 52
68
bp20 aaa
mrh 1
4's
eveready
25.660
16 1015 30 11 0 26 40
84
bp20 aa
mrh kcl 2
energizer
e91 aa 18.780
17 16 20 0 19 51
bp2+1 21
max 1
energizer
Gambar 4. Pemodelan K-means pada
e92 aaa 11.640
18
bp2+1max
16 7 0 12 53
25 Rapidminer
2
1199 bola 7.6265
Pemodelan cluster ing dengan
19 0 0 6 7.6 67
sport 02
algoritma k-means dengan jumlah cluster
7788 bola 7.8809
20 0 0 2 7.9 68
smiley 1 sebanyak 2 buah maka dengan
menggunakan rapidminer cluster yang
terbentuk juga sebanyak 2, dengan
Tabel 10. Kelompok data ke-9 cluster 0 sebanyak 657 produk, cluster 0
sebanyak 70 produk dari jumlah produk
NO C1 C2
727 item.
1 1 0
2 1 0
3 1 0
4 1 0
5 1 0
6 1 0
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 33
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 34
http://ejournal.upbatam.ac.id/index.php/cbis
CBIS JOURNAL - VOL. 06 NO. 02 (2018) : SEPTEMBER P a g e | 35
http://ejournal.upbatam.ac.id/index.php/cbis