Jenis Permasalahan Data Mining : Analisis Kluster ( Cluster Analysis )

Jenis Permasalahan Data Mining : Analisis Kluster ( Cluster Analysis )

Jenis Permasalahan Data Mining : Analisis Kluster ( Cluster Analysis )

Analisis kluster dikenal juga dengan istiloah data clustering merupakan metode yang digunakan untuk membagi rangkaian data menjadi beberapa grup berdasarkan kesamaan-kesamaan yang telah ditentukan sebelumnya. Jadi secara umum dapat dikatakan bahwa data dalam suatu kluster memiliki tingkat kesamaan yang tinggi dan data dalam kluster yang berbeda memiliki tingkat kesamaan yang rendah.

Karena itu perlu diketahui teknik-teknik yang digunakan untuk mengukur tingkat kesamaan antara lain :

  • Minowski Distance ( Masuk dalam kelompok ini Manhattan, Eulidean, dan Chebysev )
  • Tanimoto Measure
  • Pearson's Measure
  • Mahalanobis Measure

Contoh-contoh penerapan analisis kluster dapat dijumpai saat ini. Berikut ini beberapa diantaranya :
  • Segmentasi pasar. Adalah pengklasteran data yang membagi pelanggan menjadi grup-grup tertentu yang akan mempermudah bagian penjualan (marketing) dalam memasukan produk-produknya, seperti rumah, kendaraan, dan sebagainya.
  • Penklasteran Dokumen. Dokumen-dokumen yang mempunyai kemiripan yang sama, misalnya politik, ekonomi, dan bidang lainnya dikumpulkan dalam suatu grup. Manfaat yang diperoleh adalah kemudahan dalam mencari, mengorganisasi dan mensuplai data-data yang akan dimanfaatkan oleh pengguna pada bidang yang sesuai.
  • Pengklasifikasian penyakit. Pernyakit tertentu dapat dideteksi dari gejala-gejala yang menyertainya. Oleh karena itu pengklasifikasian penyakit berdasarkan gejala sangat membantu para praktisi kesehatan dalam aktivitas kesehariannya, sehingga perlakuan yang tepat dapat diterapkan untuk setiap kasus penyakit tertentu.
  • Pengklassifikasian dalam Biologi. Biologi sangat membutuhkan proses klasifikasi , misalnya dalam bioinformatika untuk mencari gen-gen terbaik berdasarkan kelas-kelas yang tebentuk.



Sumber pustaka : Pudjo Prabowo. Buku Penerapan Data Mining Dengan Matlab. Bandung: Rekayasa Sains. 2013