ArticlePDF Available

Implementasi Bee Colony Optimization Pada Pemilihan Centroid (Klaster Pusat) Dalam Algoritma K-Means

Authors:
  • Universitas Ahmad Dahlan, Indonesia

Abstract and Figures

Clustering is a method that is used to divide the data into several groups of parts. K-means (KM) is an algorithm that is often used in clustering, only just the result of KM often times get stuck in local optima i.e. the optimal solution (both maximum or minimal) on the candidate solution in the nearest neighbor only, not the whole of all existing solutions or what is commonly called the global optima. In this study aims to do improve the cluster determination process on the Kmeans algorithm using the Bee Colony Optimization (BCO) algorithm. BCO is an algorithm that works based on the way the bees search for food , BCO is famous for being able to escape from the local optima trap by recognizing which results are best from a series of optimal results . Combining BCO with KM begins with selecting a source of food early in random and using KM to resolve all the problems of clustering at every step BCO next and keep sources of food best in each iteration. The result of this research is that the BCOKM method has been proven to be able to solve the problem of data sharing, where the BCOKM method is able to form a good cluster, as shown by the resulting fitness value (the lowest value is 1221.53 and the highest value is 1233.28) all of which are better than the fitness value using K-means (1251.42). Likewise in terms of accuracy, where the use of BCOKM all showed better results (83.16%-83.30%) than the use of only K-means (83.09%)
Content may be subject to copyright.
Building of Informatics, Technology and Science (BITS)
Volume 3, No 4, Maret 2022 Page: 756763
ISSN 2684-8910 (media cetak)
ISSN 2685-3310 (media online)
DOI 10.47065/bits.v3i4.1446
Ika Arfiani, Copyright © 2022, BITS | Page 756
Implementasi Bee Colony Optimization Pada Pemilihan Centroid
(Klaster Pusat) Dalam Algoritma K-Means
Ika Arfiani11,*, Herman Yuliansyah1, M Dzikrullah Suratin2
1 Fakultas Teknologi Industri, Informatika, Universitas Ahmad Dahlan, Yogyakarta, Indonesia
2 Fakultas Teknik, Informatika, Universitas Muhammadiyah Maluku Utara, Ternate, Indonesia
Email: 1,*ika.arfiani@tif.uad.ac.id, 2herman.yuliansyah@tif.uad.ac.id, 3irul.dzi@gmail.com
Email Penulis Korespondensi: ika.arfiani@tif.uad.ac.id
Submitted: 23/03/2022; Accepted: 31/03/2022; Published: 31/03/2022
AbstrakKlastering merupakan metode yang digunakan untuk membagi data menjadi beberapa kelompok bagian. K-means (KM)
merupakan algoritma yang sering digunakan dalam klastering, hanya saja hasil dari KM sering kali terjebak di lokal optima yaitu
solusi yang optimal (baik maksimal ataupun minimal) pada kandidat solusi di tetangga terdekatnya saja bukan keseluruhan dari
semua solusi yang ada atau yang biasa disebut global optima. Pada penelitian ini bertujuan untuk melakukan memperbaiki proses
penentuan klaster pada algoritma Kmeans dengan menggunakan algoritma Bee Colony Optimization (BCO). BCO merupakan
algoritma yang bekerja berdasarkan cara lebah mencari makan, BCO terkenal mampu lolos dari jebakan lokal optima dengan
mengenali mana hasil yang terbaik dari serangkaian hasil optimal. Menggabungkan BCO dengan KM dimulai dengan memilih
sumber makanan awal secara acak dan menggunakan KM untuk menyelesaikan semua permasalahan klastering pada setiap langkah
BCO berikutnya serta menyimpan sumber makanan terbaik disetiap iterasinya. Sumber-sumber terbaik tersebut akan dipilih sumber
makanan terbaiknya berdasarkan probabilitas kecocokannya masing-masing. Hasil dari penelitian ini bahwa metode BCOKM telah
terbukti dapat menyelesaikan permasalahan pembagian data, dimana metode BCOKM mampu membentuk cluster yang baik,
ditunjukkan dari nilai fitness yang dihasilkan (nilai terendah 1221.53 dan nilai tertinggi 1233.28) semuanya lebih baik dari nilai
fitness menggunakan K-means (1251.42). Begitu pula dalam hal akurasi, dimana penggunaan BCOKM seluruhnya menunjukkan
hasil (83.16%-83.30%) lebih baik daripada penggunaan hanya K-means (83.09%).
Kata Kunci: Bee Colony Optimization; K-Means; Klastering
AbstractClustering is a method that is used to divide the data into several groups of parts. K-means (KM) is an algorithm that is
often used in clustering, only just the result of KM often times get stuck in local optima i.e. the optimal solution (both maximum
or minimal) on the candidate solution in the nearest neighbor only, not the whole of all existing solutions or what is commonly
called the global optima. In this study aims to do improve the cluster determination process on the Kmeans algorithm using the
Bee Colony Optimization (BCO) algorithm. BCO is an algorithm that works based on the way the bees search for food , BCO is
famous for being able to escape from the local optima trap by recognizing which results are best from a series of optimal results .
Combining BCO with KM begins with selecting a source of food early in random and using KM to resolve all the problems of
clustering at every step BCO next and keep sources of food best in each iteration. The result of this research is that the BCOKM
method has been proven to be able to solve the problem of data sharing, where the BCOKM method is able to form a good cluster,
as shown by the resulting fitness value (the lowest value is 1221.53 and the highest value is 1233.28) all of which are better than
the fitness value using K-means (1251.42). Likewise in terms of accuracy, where the use of BCOKM all showed better results
(83.16%-83.30%) than the use of only K-means (83.09%).
Keywords: Bee Colony Optimization; K-Means; Clustering
1. PENDAHULUAN
Klastering digunakan untuk membagi data ke dalam kelompok-kelompok yang homogen. Dalam pekerjaan
pengelompokan, label dari data belum diketahui dan dengan pengelompokan diharapkan dapat diketahui kelompok
data untuk kemudian diberi label sesuai keinginan.[1] Klastering dalam penelitian Pham dkk digunakan untuk
membagi data menjadi kelompok yang homogen, banyak aplikasi dari klastering yang telah dirasakan manfaatnya
seperti segmentasi citra, mengenali segmentasi pasar dalam bisnis, temu kembali informasi dan juga dalam
merangkum data. Pham menyajikan hasil pengujian metode pengelompokan berbasis Algoritma Bees terhadap
algoritma k-means dan GA-clustering. Algoritma itu diterapkan pada lima set data nyata (Vokal, Iris, Minyak Mentah,
Peta Kontrol dan Cacat Kayu). Metode ini menggunakan Algoritma Lebah untuk mencari set pusat klaster yang
meminimalkan metrik pengelompokan tertentu[2].
K-means (KM) dalam penelitian yang dilakukan oleh Nainggolan merupakan algoritma clustering yang umum
digunakan karena kemudahan dan waktu yang dibutuhkan untuk melakukan pembelajaran relatif cepat.[3]
Permasalahannya, hasil cluster KM sering mengacu pada solusi local optima. Yaitu solusi optimal (baik maksimum
maupun minimum) terhadap kandidat solusi pada tetangga terdekatnya, bukan seluruh solusi yang ada atau biasa
disebut global optima.[4] Menurut penelitian yang pernah dilakukan oleh Ario, dkk bahwa metode ABCKM telah
terbukti dapat menyelesaikan permasalahan pembagian data, dimana nilai silhouette yang diperoleh untuk metode ini
selalu lebih tinggi bila dibandingkan dengan metode KM.[5] Permasalahan lain pada K-means adalah bahwa metode
tersebut sangat bergantung pada penentuan titik awal centroid.[6]
Oleh karena itu diusulkan untuk mengimplementasikan algoritma Bee Colony Optimization ( BCO ) yang
umum digunakan untuk pencarian global seperti masalah Traveling Salesman Problem (TSP) yang mencari rute
termurah dan paling efisien untuk mencapai tujuan banyak tenaga penjualan. Cara kerja BCO yang menirukan lebah
Building of Informatics, Technology and Science (BITS)
Volume 3, No 4, Maret 2022 Page: 756763
ISSN 2684-8910 (media cetak)
ISSN 2685-3310 (media online)
DOI 10.47065/bits.v3i4.1446
Ika Arfiani, Copyright © 2022, BITS | Page 757
mencari makan (foregaging) dari nektar ini, dimulai dengan terbangnya lebah pekerja mencari sumber makanan yang
kemudian memberikan lokasinya kepada lebah onlooker dengan menari.[5]
Onlooker bee akan membandingkan nilai probabilitas setiap lokasi sumber makanannya dan mencari sumber
makanan disekitar sumber yang dipilih, sehingga dengan segera sumber makanan yang ditemukan sekarang lebih
banyak dari sumber sebelumnya, lebah akan melupakan informasi sebelumnya. sumber makanan dan untuk sumber
makanan habis atau tidak berubah maka sumber makanan akan ditinggalkan dan dilupakan dan lebah akan menjadi
lebah pramuka yang akan mengintai sumber makanan baru yang akan dibuat diruang pencarian. Langkah-langkah
tersebut akan dilakukan hingga ditemukan solusi global yang optimal [2].
BCO merupakan bagian dari swarm intelligence, dimana Swarm intelligence merupakan sebuah metode
penyelesaian masalah yang memanfaatkan prilaku sekumpulan agen yang saling bekerja sama. Setiap
upaya untuk merancang algoritma atau didistribusikan pemecahan perangkat terinspirasi oleh perilaku kolektif dari
serangga sosial koloni dan masyarakat hewan lainnya.[7]
Aplikasi lain dari BCO adalah penjadwalan produksi barang, yang akan digunakan untuk menjaga siklus
produksi, yang merupakan rangkaian kegiatan bisnis seperti pencatatan pesanan dari pelanggan, pencatatan bahan
baku, juga pencatatan gaji karyawan, dan kegiatan pengolahan data secara terus menerus. Peran BCO dalam mengolah
data siklus bisnis akan sangat signifikan dimana akan membutuhkan perencanaan jumlah produksi dan persediaan,
penjadwalan proses produksi dengan meminimalkan jumlah waktu proses yang dibutuhkan untuk menyelesaikan
seluruh proses produksi, dan juga mengoptimalkan biaya produksi.
Metode pengelompokkan yang digunakan dalam penelitian ini menggabungkan kedua algoritma tersebut
menjadi Bee Colony Optimization K-means (BCO KM). Metode ini akan memperbaiki atau melengkapi cara kerja
algoritma KM dalam pemilihan pusat klaster dan dengan menyisipkan sifat pencarian global BCO maka akan dipilih
kumpulan sumber makanan yang disimpan, sehingga didapatkan sumber makanan yang optimal untuk membagi data.
Sehingga dari solusi ini akan mampu memberikan solusi yang optimal atas kelemahan yang dimiliki oleh KM.
mengingat teknik clustering dengan K-means cukup sederhana [8].
2. METODOLOGI PENELITIAN
Langkah pada penelitian ini menggabungkan langkah yang ada dalam algoritma K-Means dengan menyisipkan Bee
Colony Optimization pada pemilihan klister pusatnya.
2.1 Bee Colony Optimization
Bee Colony Optimization ( BCO ) adalah salah satu algoritma optimasi yang memulai pencarian makanan. Lebah
merupakan serangga sosial yang sangat terorganisir. Koloni lebah buatan bersama-sama mencari solusi optimal
dari masalah yang diberikan. Setiap lebah buatan menghasilkan satu solusi untuk masalah ini. Ada dua fase dalam
satu langkah algoritma BCO yaitu fase maju (forward pass) dan fase mundur (backward pass)[9]
Setelah suatu area ditemukan, lebah pekerja akan menari (memberi tanda) agar nektar dapat diambil oleh lebah
onlooker. Kemudian Bee Onlooker akan menentukan sumber makanan mana yang baik untuk dipanen, dan
membiarkan sumber tersebut habis dan berubah menjadi pramuka lebah. Lebah pramuka bertugas mencari sumber
baru yang dihasilkan secara acak di ruang pencarian, dimana informasi posisi nektar yang lebih sedikit akan dilupakan
oleh lebah hingga sumber makanan terbaik ditemukan. [11].
Berikut langkah-langkah yang digunakan dalam BCO [11]:
1. Tentukan jumlah sumber makanan awal atau solusi potensial (SN) yang akan disebut X ij .
2. Mengevaluasi apakah f i (kualitas sumber makanan) dalam populasi karena semakin banyak nektar semakin besar
probabilitas lebah pencari sumber yang dipilih.
3. Masuk ke fase Employed Bee, yaitu menghitung V ij yang merupakan tetangga di sekitar X ij.
4. Masuk ke fase Onlooker Bee yang akan melakukan langkah kedua dengan tujuan menggabungkannya menjadi
sumber dengan probabilitas terbaik untuk masing-masing clusternya yang akan disebut X ij baru. Sumber akan
diulang menggunakan langkah Bee, tetapi sumber terbaik akan disimpan dalam memori sebagai sumber terbaik
dalam iterasi ini.
5. Memasuki fase Lebah Pramuka, fase ini menghasilkan sumber-sumber baru dengan syarat pengumpulan sumber
makanan belum mencapai batas Jumlah Siklus Maksimum. Fase ini akan menjembatani iterasi pertama ke iterasi
kedua dan berikutnya.
6. Pengumpulan sumber akan dibandingkan dengan probabilitas kompatibilitas sampai ditemukan sumber yang
optimal.
  󰇛󰇜󰇛 󰇜 (1)
Di mana:
SN = Jumlah sumber makanan
D = Jumlah dimensi data
K = Jumlah cluster
k = {1,2 ..., K}
i = {1,2, ..., SN}
Building of Informatics, Technology and Science (BITS)
Volume 3, No 4, Maret 2022 Page: 756763
ISSN 2684-8910 (media cetak)
ISSN 2685-3310 (media online)
DOI 10.47065/bits.v3i4.1446
Ika Arfiani, Copyright © 2022, BITS | Page 758
j = {1,2, ..., D}
 , = i-sumber makanan awal dalam dimensi ke-j
 = nilai yang lebih rendah dari setiap nilai dalam dimensi-j untuk setiap cluster
 = nilai teratas setiap dimensi-j untuk setiap cluster
 (0,1) = menghasilkan bilangan acak dengan distribusi biasa 0 sampai 1.
Hitung nilai fitness/kebugaran dengan :

 (2)



 (3)
Memulai siklus iterasi sama dengan 1 hingga MCN. Untuk setiap solusi penghitungan lebah yang digunakan
cara baru:
   󰇛 󰇜 (4)
Di mana:
 = Kandidat posisi makanan baru berdasarkan posisi lama di memori. {1,2, ... } {1,2, ... } adalah indeks
yang dipilih secara acak, tetapi k harus merupakan indeks yang berbeda dari i .
 = Angka acak antara {-1,1}
Indeks acak dalam persamaan bertujuan untuk mengontrol produksi sumber makanan tetangga di sekitar , dan
mewakili perbandingan dua posisi sumber makanan yang terlihat pada lebah. Langkah selanjutnya adalah menghitung
nilai , dan melakukan proses seleksi sebagai sumber makanan yang rakus di setiap klaster-nya.
Untuk setiap lebah pengamat akan menentukan solusi z_i berdasarkan p_i . Kemudian hitung nilai v_i sesuai
dengan langkah Employed Bee. Bandingkan dua sumber makanan yang rakus. Berdasarkan hasil probabilitas, solusi
terbaik pada iterasi ini akan disimpan.
Berdasarkan hasil probabilitas, solusi terburuk yang tersisa adalah lebah onlooker dan diganti dengan solusi
baru yang diperoleh secara acak dari :

󰇛󰇜󰇛

󰇜 (5)
Dimana :
 = Sumber makanan meninggalkan lebah pengamat dan {1,2, ..., }.
Ulangi siklus tersebut hingga Maximum Cycle Number (MCN). Jumlah Siklus Maksimum atau limit untuk
BCO KM dihitung dengan persamaan berikut:
 =   (7) (6)
Sumber pangan yang optimal diperoleh dari perbandingan nilai probabilitas kesesuaian sumber pangan
tersebut.
2.2 K-Means
K-means (KM) adalah algoritma data cluster yang mengelompokkan data berdasarkan data yang tidak berlabel kelas.
Berikut langkah-langkah yang dilakukan dalam KM [4]:
1. Tentukan banyaknya k ( cluster ).
2. Hasilkan centroid awal (titik pusat cluster) secara acak.
3. Hitung jarak setiap data ke setiap centroid dengan menggunakan rumus korelasi antara dua objek yaitu Euclidean
Distance di setiap cluster.
4. Kelompokkan setiap data menurut jarak terdekat antara data dan centroid.
5. Perbarui nilai centroid dengan nilai centroid
6. Ulangi langkah 3-5 sampai nilai centroid tidak berubah.
Jarak antara input dan centroid dihitung dengan:
(,)=√(1−1)2++()2 (7)
Di mana:
 = vektor nilai masukan { 1, 2, ...,  }
 = Nilai pusat vektor { 1, 2, ...,  }
Memperbarui nilai centroid dengan nilai centroid baru dilakukan dengan:
 (8)
Di mana:
 = Centroid baru dari k-cluster.
 = Jumlah data dalam k-cluster.
 = Vektor nilai input ke-i pada cluster ke-k .
Memilih titik pusat suatu cluster merupakan tugas yang rumit karena diatur atau diacak, jika nilai inisialisasi
yang dilakukan buruk maka pengelompokan data dapat menjadi kurang optimal [3]. Pada BCOKM , hasil perhitungan
Building of Informatics, Technology and Science (BITS)
Volume 3, No 4, Maret 2022 Page: 756763
ISSN 2684-8910 (media cetak)
ISSN 2685-3310 (media online)
DOI 10.47065/bits.v3i4.1446
Ika Arfiani, Copyright © 2022, BITS | Page 759
jarak Euclidean akan menggantikan fungsi biaya fi pada BCO , dan pemilihan centroid dilakukan dengan
menggunakan persamaan (1), dimana sumber makanan terdiri dari kombinasi centroid pada setiap cluster.
2.3 Optimasi BCOKM
Algoritma Bee Colony Optimization akan digunakan untuk menanggulangi kelemahan pada penentuan pusat kluster
dalam K-means guna penentuan sumber makanan terbaik. Kelemahan tersebut adalah tingkat akurasi hasil klaster
sangat tergantung dari penentuan titik awal pusat kluster sehingga sensitif terhadap penentuan titik awal dan
memungkinkan hasil klaster konvergen pada lokal optimal [12]. Optimasi merupakan suatu proses yang memiliki
tujuan untuk mencapai hasil yang optimal (nilai efektif yang dapat dicapai). Penggunaan KM seringkali menghasilkan
solusi yang optimal. kandidat solusi pada tetangga terdekat bukanlah keseluruhan dari semua solusi yang ada atau
biasa disebut global optima. Jadi menggunakan BCO akan membantu untuk menghindari terjebak dalam local optima
dalam KM.
Algoritma BCOKM akan menghasilkan sumber makanan terbaik yang telah disimpan dari fase onlooker pada
setiap iterasi, kemudian sumber optimal akan dipilih dengan cara yang sama, berdasarkan nilai probabilitas fitness
terbesar. Sehingga hasil terbaik akan menjadi KM terakhir kali untuk mendapatkan hasil data sharing/clustering.
sumber makanan ini. Berikut ini akan dijelaskan metode BCOKM menggunakan flow chart yang akan
menggambarkan langkah-langkah dari Bee Colony Optimization K-means secara umum, yang akan dijelaskan pada
Gambar 1. Seperti yang telah diketahui, BCO KM memiliki 4 fase utama selain fase input dan output yaitu tahap
inisialisasi sumber makanan, employed bee, onlooker bee dan scout bee. Ketiga fase proses employed, onlooker, dan
scout bee akan terus diulang hingga kriteria terminasi perulangan dipenuhi dan sumber makanan terbaik yang
diperoleh akan dipilih sebagai solusi terakhir[12]. Sumber makanan terbaik yang didapatkan setelah itu akan dipilih
menjadi solusi terakhir. K-means dilakukan kembali menggunakan sumber tersebut untuk membentuk kelompok
cluster sebagai hasil uji coba untuk perhitungan akurasi[13].
Berdasarkan permasalahan tersebut, diperlukan metode yang dapat menghitung rute paling optimal dalam
melakukan distribusi barang. Dalam penelitian ini akan digunakan metode Artificial Bee Colony (ABC) untuk
mensolusikan masalah di Nida Food. Algoritma ini terinspirasi dari perilaku sekumpulan lebah berkelompok untuk
mencari sumber makanan. Setelah mereka menemukan sumber makanan kemudian mereka akan kembali ke sarang
dan melakukan tarian lebah (waggle dance), dengan menggunakan waggle dance semua koloni saling
berkomunikasi tentang sumber makanan yang mereka temukan, sehingga lebah-lebah yang lain akan mengetahui
letak dari sumber makanan yang paling dekat dari sarang[14]
2.4 Pengujian Akurasi
Pengukuran akurasi digunakan untuk mengtahui seberapa baik hasil dari penelitian yang dilakukan.[15]. Akurasi
didefinisikan sebagai tingkat kedekatan antara nilai prediksi dengan nilai aktual. Pada information extraction terdapat
beberapa istilah yaitu precision, recall dan f-measure. Precision adalah tingkat ketepatan antara informasi yang diminta
oleh pengguna dengan jawaban yang diberikan oleh sistem. Recall adalah tingkat keberhasilan sistem dalam
menemukan kembali sebuah informasi. F-Measure merupakan salah satu perhitungan evalusasi dalam informasi temu
kembali yang mengkombinasikan recall dan precission. Nilai recall dan precission pada suatu keadaan dapat memiliki
bobot yang berbeda. Ukuran yang menampilkan timbal balik antara Recall dan Precission adalah F-Measure yang
merupakan bobot harmonic mean, recall dan precission[15].
Pada tahap ini, kinerja program diuji untuk masalah berbagi data. Uji performansi ini dilakukan dengan menentukan
nilai akurasi dan fitness dari pengelompokan sumber makanan yang dihasilkan setelah menggunakan algoritma
BCOKM dengan menggunakan jumlah sumber makanan dan variasi parameter iterasi ABC meningkat. Jumlah
variabel dimensi dan cluster ditentukan dengan cara yang sama di semua percobaan. Artinya, jumlah dimensi yang
dipakai adalah 5, dan jumlah clusternya adalah 10.
2.5 Tahapan Penelitian
Tahapan dari penelitian yang dilakukan untuk mengelompokkan data siswa dapat dilihat pada Gambar 1, dimana
dalam tahapan ini sudah menerapkan gabungan antara metode K-Means yang didalamnya dimodifikasi dengan Bee
Colony Optimization. Gambar 1 menunjukkan beberapa langkah untuk menganalisis data cluster mahasiswa, yaitu :
a. Input data set mahasiswa dan inisialisasi parameter awal
Inisialisasi parameter awal dibagi menjadi parameter data mahasiswa dan parameter algoritma BCOKM.
1. Data mahasiswa dibagi menjadi delapan variabel, yaitu Nomor Mahasiswa (SN), Nama, Jurusan (Dept),
Lama Pengerjaan Skripsi (LT), Tanggal Registrasi (RD), Tanggal Wisuda (GD) , Indeks Prestasi Kumulatif
(GPA), dan Skor Kecakapan Bahasa Inggris (EP)
2. Parameter BCOKM meliputi jumlah kelompok, jumlah iterasi/MCN.
b. Proses tahapan BCOKM
1. Fase Inisialisasi K pusat secara random
Building of Informatics, Technology and Science (BITS)
Volume 3, No 4, Maret 2022 Page: 756763
ISSN 2684-8910 (media cetak)
ISSN 2685-3310 (media online)
DOI 10.47065/bits.v3i4.1446
Ika Arfiani, Copyright © 2022, BITS | Page 760
Pada tahap ini dilakukan inisialisasi sumber makanan awal. Sumber makananan diinisialisasi secara acak dan
masing-masing sumber makanan merepresentasikan satu centroid. Setiap sumber makanan nantinya akan
diberi satu Employee bee. Menggunakan algoritma K-Means untuk clustering dan kemudian menghitung nilai
rerata fitness
2. Fase Employee bee
Setiap Employee bee akan mencari sumber makanan baru untuk mendapatkan sumber makanan dengan jumlah
nectar yang lebih banyak disekitar sumber makanan sekarang. Menggunakan algoritma K-Means untuk
clustering dan menghitung nilai fitness. Kemudian melakukan seleksi greedy untuk evaluasi nilai fitnes sumber
makanan baru dan membandingkannya dengan sebelumnya. Sumber makanan yang lebih baik akan diterima
oleh onlooker bee.
3. Fase Onlooker bee
Onlooker bee menunggu informasi sumber makanan dari Employee bee. Onlooker bee akan mengerjakan
langkah kedua dengan tujuan menggabungkannya menjadi sumber makanan dengan nilai probabilitas tertinggi
untuk setiap clusternya. Kemudian dilakukan perhitungan nilai probabilitas kumulatifnya menggunakan seleksi
roulette wheel. Sumber makanan kemudian akan diulang langkah Employee bee, tetapi sumber makanan
terbaik akan disimpan di memori sebagai sumber makanan terbaik di iterasi tersebut.
4. Fase Scout bee
Pada fase ini, membangkitkan sumber makanan baru dengan kondisi kumpulan sumber makanan belum
mencapai batas limit parameter atau MCN. Fase ini akan menjembatani iterasi pertama ke iterasi kedua dan
seterusnya.
5. Pemilihan Sumber Makanan Terbaik
Ketiga fase (Employee bee, Onlooker bee dan Scout bee) akan terus menerus diulangi sampai ke batas iterasi.
Sumber makanan terbaik dari semua iterasi akan dipilih sebagai solusi akhir kemudian dihitung nilai
fittnessnya dan nilai fitness terbaik akan menjadi solusi sumber makanan terbaik oleh bee.
c. Hasil Pengelompokan
Hasil pengelompokan data mahasiswa ini berupa jumlah anggota pada setiap cluster dan nilai fitness beserta nilai
silhoutte untuk mengetahui kualitas pengelompokan.
YA
Pusat1Max1
mulai
SELESAI
TIDAK
Input
dataset &
parameter
Inisialisasi K titik
pusat secara
random
PusatBCOKM =
1
Pusat1=1
Pusat2=2
Update titik pusat
EmployeeBee dan
OnlookerBee dengan
tahapan upda te pada BCO
Pusat1=Pusat1+1
Posisi tit ik pusat
terbaik lebah
Update titik pusat dengan
tahapan update pada KM
Pusat2=Pusat2+1
TIDAK
Selisih  ε &&
Pusat2  Max2
YA
Posisi titik
pusat KM
PusatBCOKM 
MaxBCOKM
PusatBCOKM=PusatBCOKM+1
YA
Tetapkan
keanggotaan
data pada klaster
TIDAK
Posisi titik pusat
BCOKM dan
anggotanya
Gambar 1. Flowchart Tahapan penelitian penerapan BCOKM
Building of Informatics, Technology and Science (BITS)
Volume 3, No 4, Maret 2022 Page: 756763
ISSN 2684-8910 (media cetak)
ISSN 2685-3310 (media online)
DOI 10.47065/bits.v3i4.1446
Ika Arfiani, Copyright © 2022, BITS | Page 761
3. HASIL DAN PEMBAHASAN
Dataset dari sebuah lembaga pendidikan swasta berisi 724 baris data dengan delapan variabel, yaitu Nomor Mahasiswa
(SN), Nama, Jurusan (Dept), Lama Pengerjaan Skripsi (LT), Tanggal Registrasi (RD), Tanggal Wisuda (GD) , Indeks
Prestasi Kumulatif (GPA), dan Skor Kecakapan Bahasa Inggris (EP). Tabel 1 menunjukkan kumpulan dataset.
Tabel 1. Dataset penelitian berupa data mahasiswa
Data Row
Sn
Dept
Lt (Month)
Rd
Gd
Ep
1
08018001
Inf
13.6
2008-09-08
2014-02-17
406
2
08018003
Inf
6.8
2008-09-08
2012-12-22
400
3
08018004
Inf
4.83
2008-09-08
2013-01-05
403
723
1400018238
Inf
2.8
2014-09-01
2018-06-28
430
724
1400018243
Inf
2.8
2014-09-01
2018-06-28
413
Nilai fitness suatu sumber makanan dari lebah merupakan nilai total dari jarak sebuah node (data) menuju
cluster yang terdekat darinya, yang dihitung dengan Sum of Squared Error (SSE). Semakin kecil nilai fitness yang
dihasilkan, maka semakin baik cluster yang terbentuk, Hasil percobaan pada Tabel 2 menunjukkan bahwa secara
keseluruhan nilai fitness yang dihasilkan hanya dengan menggunakan K-means yaitu 1251,42 lebih tinggi
dibandingkan dengan menggunakan BCOKM, yaitu antara nilai terendah yang diperoleh dari pengujian dengan 100
SN dan 100 iterasi (1221,53) dan nilai tertinggi diperoleh dari pengujian menggunakan 50 SN dan 50 iterasi (1233.28),
hal ini menunjukkan bahwa cluster yang terbentuk pada BCO lebih baik.
Tabel 2. Nilai Fitness
FITNESS
JUMLAH SUMBER MAKANAN
Kmeans
20
30
50
75
100
AVG
Kmeans
1251,42
ITERASI
25
1224,57
1226,31
1226,25
1223,22
1221,96
1224,46
50
1231,54
1227,52
1233,28
1225,37
1221,77
1227,9
75
1225,46
1224,85
1225,73
1222,98
1223,01
1224,41
100
1230,05
1225,41
1223,92
1223,47
1221,53
1224,88
AVG
1227,905
1227,4625
1225,855
1223,76
1222,07
Hasil dari percobaan dengan 764 data pada 100 iterasi menunjukkan bahwa secara keseluruhan, nilai fitness
yang dihasilkan :
a. Jika hanya pakai K-means saja, yaitu 1251.42, lebih tinggi daripada menggunakan BCOKM,
b. BCOKM yaitu nilai terendah 1221.53 dan nilai tertinggi 1233.28 menunjukkan bahwa cluster yang terbentuk pada
BCO lebih baik.
Hasil dari pengujian tingkat ketepatan antara informasi yang diminta oleh pengguna dengan jawaban yang
diberikan oleh system atau tingkat presisi datanya disajikan dalam Tabel 4 bahwa Nilai precision dari K-means
mampu mengungguli BCOKM yakni 11.09%, hanya saja pada pada iterasi sebanyak 25 kali dengan SN sebesar 30
dan 50 yang keduanya bernilai 11.48%, dan iterasi 75 dengan SN 30 dan 50 yang masing-masing bernilai 11.53% dan
11.03%. Tabel 4. Nilai Precision
PRECISION
JUMLAH SUMBER MAKANAN
Kmeans
20
30
50
75
100
AVG
Kmeans
11.09%
ITERASI
25
10.70%
11.48%
11.48%
11.05%
11.17%
11,18%
50
11.16%
11.03%
11.05%
11.12%
11.07%
11,09%
75
11.16%
11.53%
11.03%
10.97%
11.06%
11,15%
100
11.07%
11.25%
11.04%
11.14%
11.12%
11,12%
AVG
11,02%
11,32%
11,15%
11,07%
11,11%
Sedangkan untuk mengetahui tingkat keberhasilan sistem dalam menemukan kembali sebuah informasi atau
Recall disajikan dalam Tabel 5 bahwa Nilai recall terbaik muncul ketika digunakan 100 SN dengan 25 kali iterasi
(12.44%). Disini nilai recall algoritma K-means saja (11.98%) masih kalah dibandingkan sebagian besar penggunaan
BCOKM. Meskipun demikian masih terdapat nilai recall lebih rendah dari K-means, yaitu pada penggunaan 20 SN
dengan 25 kali iterasi (11.78%) dan 30 SN dengan 50 kali iterasi (11.62%).
Building of Informatics, Technology and Science (BITS)
Volume 3, No 4, Maret 2022 Page: 756763
ISSN 2684-8910 (media cetak)
ISSN 2685-3310 (media online)
DOI 10.47065/bits.v3i4.1446
Ika Arfiani, Copyright © 2022, BITS | Page 762
Tabel 5. Nilai Recall
RECALL
JUMLAH SUMBER MAKANAN
Kmeans
20
30
50
75
100
AVG
Kmeans
11.98%
ITERASI
25
11.78%
12.40%
12.47%
12.28%
12.44%
12.27%
50
12.22%
11.62%
12.31%
12.39%
12.31%
12.17%
75
12.33%
12.46%
12.36%
12.22%
12.16%
12.31%
100
12.36%
12.36%
12.27%
12.29%
12.30%
12.32%
AVG
12.17%
12.21%
12.35%
12.29%
12.30%
Selanjutnya dilakukan perhitungan akurasi untuk mengetahui seberapa akurat pengelompokan yang dihasilkan
melalui penggunaan BCOKM. Akurasi pengelompokan data akan dihitung berdasarkan kelas benchmark yang
diperoleh dari dataset. Pada Tabel 3 diperoleh akurasi yang dihasilkan lebih baik bila jumlah iterasi yang digunakan
adalah 25 (83,25%). Rata-rata akurasi terburuk justru didapat saat uji coba dilakukan menggunakan 100 SN dengan
100 kali iterasi (83,16%). Sedangkan akurasi yang dihasilkan hanya dengan menggunakan K-means (83,09%) masih
lebih rendah dibandingkan dengan penggunaan metode BCOKM tanpa memperhatikan jumlah SN dan iterasi.
Tabel 3. Nilai Akurasi
RAND MEASURE
JUMLAH SUMBER MAKANAN
Kmeans
20
30
50
75
100
AVG
Kmeans
83.09%
ITERASI
25
83.30%
83.20%
83.27%
83.24%
83.24%
83,25%
50
83.19%
83.18%
83.23%
83.21%
83.24%
83,21%
75
83.29%
83.21%
83.19%
83.20%
83.27%
83,23%
100
83.23%
83.24%
83.21%
83.19%
83.16%
83,21%
AVG
83,25%
83,21%
83,23%
83,21%
83,23%
Hasil dari percobaan dengan 764 data pada 100 iterasi menunjukkan bahwa secara keseluruhan, nilai akurasi
yang dihasilkan:
a. Jika hanya pakai K-means saja, yaitu 83,09%, lebih rendah daripada menggunakan BCOKM,
b. BCOKM yaitu nilai terendah 83,16% dan nilai tertinggi 83,30% menunjukkan bahwa cluster yang terbentuk pada
BCOKM lebih baik
4. KESIMPULAN
Berdasarkan hasil pengujian dan evaluasi yang telah dilakukan bahwa metode BCOKM telah terbukti dapat
menyelesaikan permasalahan pembagian data, dimana metode BCOKM mampu membentuk cluster yang baik,
ditunjukkan dari nilai fitness yang dihasilkan (nilai terendah 1221.53 dan nilai tertinggi 1233.28) semuanya lebih baik
dari nilai fitness menggunakan K-means (1251.42). Begitu pula dalam hal akurasi, dimana penggunaan BCOKM
seluruhnya menunjukkan hasil (83.16%-83.30%) lebih baik daripada penggunaan hanya K-means (83.09%). Nilai
precision dan recall yang dihasilkan rendah, berkisar antara 11-12%. Hal ini kemungkinan disebabkan karena dataset
yang digunakan sebenarnya lebih cocok digunakan untuk permasalahan klasifikasi yang merupakan metode
pembelajaran dimana kelas awal data telah diketahui (supervised learning) dan bukan clustering pada algoritma K-
means dan BCOKM yang merupakan metode unsupervised learning. Namun, penelitian ini juga menemukan bahwa
hasil pengelompokan data yang telah dilakukan memiliki titik pusat yang berdekatan sehingga tidak dapat mewakili
karakteristik siswa yang ingin dicari. Kami memperkirakan bahwa jumlah data yang kami gunakan terlalu kecil dan
perlu mengevaluasi distribusi data. Peningkatan ini akan berfungsi untuk keberlanjujtan penelitian ini.
REFERENCES
[1] Prasetyo, E., 2012. Data Mining Konsep dan Aplikasi Menggunakan Matlab, Andi Offset, Yogyakarta.
[2] Pham, D. T., Otri, S., Afifiy, A., Mahmuddin, M., & Al-Jabbouli, H. 2007. Data Clustering Using the Bees Algorithm.
[3] Nainggolan, Rena., 2014. Algoritma Modified K-Means Clustering Pada Penentuan Cluster Centre Berbasis Sum Of Squared
Error (SSE). Thesis. Program Studi S2 Teknik Informatika Fakultas Ilmu Komputer Dan Teknologi Informasi, Universitas
Sumatera Utara, Medan.
[4] Aggarwal, C. C. (2015). Data Mining: The Textbook. New York.
[5] Nugroho, B. Ario,. Purwitasari, D., Fatichah, C., 2016. Implementasi Artificial Bee Colony Untuk Pemilihan Titik Pusat
pada Algoritma K-means. Jurnal Teknik ITS, Vol. 5, No. 2, pp. A608-A613, ISSN:2337-3539
[6] Armano, G., & Farmani, M. R. 2014. Clustering Analysis with Combination of Artificial Bee Colony Algoritihm and k-
Means Technique. s.l. : International Journal of Computer Theory and Engineering.
[7] Bonabeau, E., Dorigo, M., dan Theraulaz, G., 1999, Swarm Intelligence from Natural to Artificial Systems,
Oxford University Press, New York
Building of Informatics, Technology and Science (BITS)
Volume 3, No 4, Maret 2022 Page: 756763
ISSN 2684-8910 (media cetak)
ISSN 2685-3310 (media online)
DOI 10.47065/bits.v3i4.1446
Ika Arfiani, Copyright © 2022, BITS | Page 763
[8] P.-N. Tan, M. Steinbach, and V. Kumar. 2005. Introduction to Data Mining. Boston, MA, USA : Addison-Wesley Longman
Publishing Co., Inc., 2005.
[9] Pratama, J. Danar., 2019. Penerapan Algoritma Bee Colony Optimization Dalam Pencarian Rute Tercepat Rumah Sakit di
Kota Bogor. Jurnal Riset Komputer (JURIKOM), Vol. 99 No. 99, ISSN 2407-389X (Media Cetak) Hal: 999-999.
[10] Kaur, A., Goyal, S., 2011. A Survey on the Applications of Bee Colony Optimization Techniques, International Journal
on Computer Science and Engineering(IJCSE), India, 8 Agustus 2011, vol. 3, 3037 3046, ISSN : 0975 3397.
[11] Karaboga, D., & Ozturk, C. 2009. A Novel Clustering Approach: Bee Colony Optimization(BCO) algorithm.
[12] R. E. Funderlic, M. T. Chu, N. Orlowski, D.Schlor, and J. Blevins, 2019. “Convergence andOther Aspects of the k-modes
Algorithm forClustering Categorical data,”
[13] Novianto, Rizki., 2017. Optimasi K-Means Dengan Artificial Bee Colony Untuk Pengelompokan Resolusi Tahun Baru Dari
Data Twitter. Undergraduate Thesis. Institute Teknologi Sepuluh November.
[14] E. Rahmandha, R. Efendi, and D. Puspitaningrum, 2016. Aplikasi Pencarian Lokasi Fasilitas Peayanan Umum
Terdekat Menggunakan Metode Artificial Bee Colony Di Kota Bengkulu Berbasis Webview Android,” J. Teknol. Inf.,
vol. 12, pp. 141154.
[15] Nugroho, Fajar 2019 Sistem Rekomendasi Kata Kunci Untuk Website Menggunakan Hybrid Semantic Relatedness Dan
Associative Neural Network. Masters thesis, Universitas Komputer Indonesia.
... Oleh karena itu, diperlukan teknik optimisasi untuk meningkatkan hasil evaluasi yang dapat mengatasi masalah hasil evaluasi yang kurang optimal karena penentuan sentroid secara acak. Terdapat beberapa teknik optimasi yang bisa digunakan, salah satunya adalah teknik elbow [8], metode Artificial Bee Colony [9], metode Particle Swarm Optimization [10], metode Genetic Algorithm [11], metode Support Vector Machine [12], metode Sum of Square Error [13], metode Pillar [14], metode Fuzzy Metrics [15], metode Bee Colony Optimization [16]. Dari beberapa metode tersebut, peneliti akan memilih 3 metode yang sering digunakan oleh peneliti lain untuk dioptimalkan dengan menggunakan data dari dataset yang sama. ...
Article
Full-text available
Peningkatan heterogenitas dan kompleksitas data yang terus bertambah besarnya menyulitkan pengolahan data besar secara manual. Dalam bidang data mining, algoritma K-Means sering digunakan untuk mengelompokkan data berdasarkan kedekatan atau kemiripan. Tetapi, algoritma K-Means menghadapi beberapa tantangan, terutama dalam menentukan jumlah cluster dan pemilihan sentroid awal yang dapat memengaruhi hasil pengelompokkan. Artikel ini membahas persoalan tersebut dan menyajikan tiga metode optimasi berupa Elbow, Particle Swarm Optimization (PSO), dan sum square of error (SSE) untuk meningkatkan hasil evaluasi algoritma K-Means. Berdasarkan evaluasi, kesimpulannya adalah bahwa metode elbow lebih cepat dalam iterasi waktu dibandingkan dengan metode PSO, walaupun keduanya menghasilkan nilai DBI yang sama. Waktu iterasi metode elbow hanya 0.0002 detik, SSE hanya 1.8401 detik, sementara metode PSO memerlukan waktu iterasi selama 771.2143 detik. Dengan demikian, metode elbow lebih efisien dalam hal waktu iterasi karena menggunakan SSE. Rekomendasi untuk penelitian berikutnya adalah menggunakan kumpulan data yang berbeda dan mempertimbangkan metode optimasi lainnya untuk melakukan perbandingan evaluasi secara lebih komprehensif.
... Penelitian dari [11] melakukan reduksi atribut dengan Gini Index pada K-Nearest Neighbor pada klasifikasi kinerja siswa dengan hasil yang diperoleh yaitu peningkatan akurasi K-NN setelah reduksi atribut dari 74.068 % menjadi 76.516 %. Penelitian dari [12] melakukan kombinasi K-Means dengan Bee Colony Optimization (BCO) pada pengelompokan data dengan hasil yang diperoleh yaitu peningkatan performa K-Means setelah dikombinasikan dengan BCO yaitu dari 83.09 % menjadi 83.30%. ...
Article
Full-text available
In K-Means Clustering, the number of attributes of a data can affect the number of iterations generated in the data grouping process. One of the solutions to overcome these problems is by using a reduction technique on the dimensions of the dataset. In this study, the authors apply the Gini Index to perform attribute reduction on the data set to reduce attributes that have no effect on the dataset before clustering with K-Means Clustering. The dataset used to be tested as a testing instrument in this research is Absenteeism at work obtained from the UCI Machine Learning Repository, with 20 attributes, 740 data records and 4 attribute classes. The results of the tests in this research indicate that the number of iterations obtained from the comparison of tests using the K-Means in a Conversional (Without Attribute Reduction) is obtained by the number of 9 iterations, while the K-Means with attribute reduction with the Gini Index obtains the number of iterations totaling 6 iterations. Clustering evaluation was calculated using Sum of Square Error (SSE). The SSE value in K-Means Clustering in a Conversional (Without Attribute Reduction) is 1391.613, while in K-Means Clustering with attribute reduction with a Gini Index, it is 440.912. From the results of the proposed method, it is able to reduce the percentage of errors and minimize the number of iterations in K-Means Clustering by reducing the dimensions of the dataset using the Gini Index
Article
Full-text available
Pada era digital saat ini, platform komunitas online telah menjadi pusat interaksi dan pertukaran informasi. Dalam konteks ini, MyAnimeList, sebuah platform yang digunakan oleh peminat animasi untuk berbagi preferensi dan ulasan mengenai anime, memiliki peran yang signifikan. Penelitian ini menerapkan K-Means Clustering dan Heatmap untuk menganalisis peminat animasi pada MyAnimeList. Total data penonton telah diperoleh langsung dari platform MyAnimeList berjumlah 20.535.533 score vote yang akan dianalisis menggunakan K-Means Clustering, guna mengelompokkan penonton berdasarkan kesamaan preferensi mereka terhadap anime. Hasil analisis ini akan divisualisasikan menggunakan teknik Heatmap untuk mengungkapkan pola tontonan peminat terhadap judul yang disukai. Metode ini memungkinkan klasterisasi peminat berdasarkan judul dan skor. Hasilnya memunculkan empat klaster yang ditandai dengan warna berbeda. Klaster dengan warna hijau (6%), diikuti oleh klaster biru (17%), kuning (37%), dan klaster berwarna merah (41%). Informasi ini diharapkan dapat membantu penonton baru dalam memilih dan memilah judul animasi yang cocok dengan minat mereka.
Chapter
In this research a Bee Colony Optimization algorithm (BCO) for stabilization of a D.C Motor Speed Controller is presented. The first idea of the BCO is to find of the optimal design of the Membership Functions (MFs) in the Type-1 Fuzzy Logic System (T1FLS). BCO algorithm shows excellent results when real problems are analyzed in the Fuzzy Logic Controller (FLC). Some types of indices performance implemented in the field of the control are used. With the goal of verifying the efficiency of the BCO a comparative with other bio-inspired algorithms for the stabilization of the case study.KeywordsFuzzy setsBeeFuzzy logic controllerSpeedUncertainty
Article
Full-text available
Public services are growing as concomitants of the Bengkulu's population growth. That fact makes it hard to find a certain public service in Bengkulu city. Another reason is we need to find a nearby public service to do daily tasks. The purpose of tis research are: (1) to show a nearby public service's location. (2) To implement Artificial Bee Colony method in Bengkulu City's Public Services Finder using Webview Android. The results are: (1) This research managed to implement public services finder in to map;(2) The result of algorithm relevancy test using abc base is quite high, 81% relevant, Meanwhile for standard abc is 2.91%. (3) The best parameter setting is using bees (CS) {30,50}. Maximum limit (L) {300,500,600} and maximum iteration (MCN) {30,50}.(4) The best bees setting are (CS) 30, maximum limit (L) 1000 maximum iteration 50. Artificial Bee Colony linier relevancy using employed bees and defined iterations meanwhile maximum limit parameter is not taking effect on the algorithm. 1. PENDAHULUAN Fasilitas umum sangat identik dengan pusat pelayanan masyarakat seperti yang berkaitan dengan perekonomian, keamanan, pelayanan umum, pemerintahan dan kebutuhan lain. Fasilitas pelayanan umum semakin berkembang seiring dengan pertambahan jumlah penduduk di Kota Bengkulu. Perkembangan Kota Bengkulu cukup pesat menuntut pemerintah atau pihak yang berkepentingan untuk meningkatkan pembangunan fasilitas pelayanan kepada masyarakat secara merata. Berbagai kepentingan yang membutuhkan fasilitas pelayanan umum menjadi salah satu alasan mengapa diperlukannya fasilitas umum untuk membantu kelancaran dalam kegiatan sehari-hari. Selama ini adanya kesulitan dalam menemukan lokasi fasilitas pelayanan umum. Hal ini disebabkan oleh kurangnya informasi lokasi yang ingin dituju. Informasi hanya terdapat pada daerah tertentu saja. Belum adanya informasi bagi fasilitas pelayanan umum di sistem informasi. Akibatnya masyarakat umum kesulitan dalam menemukan lokasi fasilitas pelayanan umum yang ingin dituju. Fasilitas umum yang dimaksud adalah rumah sakit, hotel, bank, SPBU (Stasiun Pengisian Bahan Bakar Umum), ATM, tempat ibadah, mall dan pasar di Kota Bengkulu. Untuk itu diperlukan sebuah sistem informasi yang dapat membantu masyarakat menemukan fasilitas pelayanan umum. Hal ini dapat menjadi salah satu cara untuk menyelesaikan permasalahan seseorang yang akan mencari lokasi fasilitas pelayanan umum terdekat di daerah Kota Bengkulu. Berdasarkan permasalahan dan penelitian yang telah dilakukan sebelumnya, diperlukan suatu metode
Article
Full-text available
Clustering is a popular data analysis and data mining technique. Among different proposed methods, k-means is an efficient clustering technique to cluster datasets, but this method highly depends on the initial state and usually converges to local optimum solution. This paper takes the advantage of a novel evolutionary algorithm, called artificial bee colony (ABC), to improve the capability of k-means in finding global optimum clusters in nonlinear partitional clustering problems. The proposed method is the combination of k-means and ABC algorithms, called kABC, which can find better cluster portions. Both kABC and k-means are run on three known data sets from the UCI Machine Learning Repository. The simulation results show that the combination of ABC and k-means technique has more ability to search for global optimum solutions and more ability for passing local optimum. Index Terms—Artificial bee colony algorithm, k-means.
Article
Full-text available
In this paper an overview of the areas where the Bee Colony Optimization (BCO) and its variants are applied have been given. Bee System was identified by Sato and Hagiwara in 1997 and the Bee Colony Optimization (BCO) was identified by Lucic and Teodorovic in 2001. BCO has emerged as a specialized class of Swarm Intelligence with bees as agents. It is an emerging field for researchers in the field of optimization problems because it provides immense problem solving scope for combinatorial and NP-hard problems. BCO is one of the benchmark systems portraying team work, collaborative work. BCO is a bottom-up approach of modeling where agents form global solution by optimizing the local solution.
Article
Full-text available
Three example variants of the k-modes algorithm are compared as tools to illustrate the eects of ties on convergence of any k-modes like algorithm. Two types of ties are discussed as well as their aect on the convergence of the 3 variants. These consequences of resolving these ties are shown to greatly aect speed of convergence and quality of results. Other aspects pertinent to the success of any k-modes method are dis- cussed. These topics include: Cluster Death(empty clusters), the duality of the similarity/dissimilarity functions, starting with clusters or modes and restricting the domain of the mode vectors.
Data Mining Konsep dan Aplikasi Menggunakan Matlab
  • E Prasetyo
Prasetyo, E., 2012. Data Mining Konsep dan Aplikasi Menggunakan Matlab, Andi Offset, Yogyakarta.
Algoritma Modified K-Means Clustering Pada Penentuan Cluster Centre Berbasis Sum Of Squared Error (SSE)
  • Rena Nainggolan
Nainggolan, Rena., 2014. Algoritma Modified K-Means Clustering Pada Penentuan Cluster Centre Berbasis Sum Of Squared Error (SSE). Thesis. Program Studi S2 Teknik Informatika Fakultas Ilmu Komputer Dan Teknologi Informasi, Universitas Sumatera Utara, Medan.
Data Mining: The Textbook
  • C C Aggarwal
Aggarwal, C. C. (2015). Data Mining: The Textbook. New York.
Penerapan Algoritma Bee Colony Optimization Dalam Pencarian Rute Tercepat Rumah Sakit di Kota Bogor
  • J Pratama
  • Danar
Pratama, J. Danar., 2019. Penerapan Algoritma Bee Colony Optimization Dalam Pencarian Rute Tercepat Rumah Sakit di Kota Bogor. Jurnal Riset Komputer (JURIKOM), Vol. 99 No. 99, ISSN 2407-389X (Media Cetak) Hal: 999-999.