JURNAL : KLASTERING DATA MENGGUNAKAN ALGORITMA DYNAMIC K-MEANS

JURNAL : KLASTERING DATA MENGGUNAKAN ALGORITMA DYNAMIC K-MEANS

KLASTERING DATA MENGGUNAKAN ALGORITMA DYNAMIC K-MEANS
Abstrak — Salah satu kekurangan algoritma K-means yaitu mempunyai masalah sensitif terhadap penentuan partisi awal jumlah cluster(k) penentuan nilai awal yang berbeda mungkin dapat menghasilkan kelompok cluster yang berbeda pula. Untuk menyelesaikan masalah sensitifitas partisi awal jumlah cluster pada algoritma K-means, maka diusulkan algoritma cluster dinamik. Hasil percobaan menunjukan bahwa algoritma Dynamic K-means, dapat menghasilkan kualitas cluster yang lebih optimal dibandingkan dengan K-means. 

Kata kunci : Segmentasi Pelanggan, K-Means, quality cluster


I. PENDAHULUAN 
Algortima K-means adalah algoritma clustering yang paling populer digunakan karena memiliki kelebihan yaitu algoritma yang sederhana dan mudah diimplementasikan. Salah satu kekurangan algoritma K-means yaitu mempunyai masalah sensitif terhadap penentuan partisi awal jumlah cluster(k) dan solusi akhir menyatu pada local minima. Penentuan partisi jumlah cluster(k) sangat penting bagi algoritma K-means, tetapi tidak ada ketentuan yang berlaku untuk menentukan berapa jumlah cluster(k) yang akan dibentuk penentuan partisi jumlah cluster diawal yang sangat sulit, penentuan nilai awal yang berbeda mungkin dapat menghasilkan kelompok cluster yang berbeda pula. Beberapa penelitian yang telah dilakukan mengenai masalah sensitifitas inisialisasi jumlah cluster(k), dan algoritma yang digunakan.

Deelers dan Auwatanamongkol, dalam paper yang berjudul “Enhancing K-means Algoritm With Initial Cluster Center Derived from Data Partitioning along the Data Axis with the Highest Variance”, algoritma yang digunakan adalah algoritma partisi data. Baolin Yi dalam paper yang berjudul “An Improved Initialization Center Algorithm for K-means Clustering”, algoritma yang digunakan adalah algoritma inisialisasi pusat cluster berbasis kepadatan (density). Zhang dan Fang, dalam judul “An improved K-means Algorithm”, metode yang digunakan Genetic algoritm (GA). Berdasarkan penelitian-penelitian terdahulu, metode K-means paling banyak digunakan dalam segmentasi, untuk memecahkan masalah sensitifitas partisi awal jumlah cluster(k), pada penelitian ini mengusulkan algoritma cluster dinamik pada algoritma K-means untuk menghasilkan kualitas cluster yang optimal sehingga dapat memberikan hasil yang lebih baik dan tepat. Maksud dari penelitian ini adalah untuk menerapkan algoritma dynamic K-means untuk mendapatkan kualitas cluster yang optimal. Hasil cluster akan di evaluasi menggunakan Davies-Bouldin Index (DBI).

DOWNLOAD JURNAL