Klasterisasi dalam Data Mining

Klasterisasi dalam Data Mining


Klasterisasi (clustering)

Mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok tertentu memiliki set properti yang dishare bersama, dengan tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah. Disebut juga dengan ‘unsupervised learning’.

Jika diberikan sejumlah titik data yang masing-masing mempunyai sejumlah atribut dan dengan menggunakan satu ukuran similaritas, dapat ditemukan klaster-klaster sedemikian hingga:
Titik-titik data dalam satu klaster mempunyai similaritas yang lebih besar.
Titik-titik data dalam klaster yang berbeda mempunyai similaritas yang kecil.

Ukuran simillaritas yang digunakan :
- Euclidean Distance jika atributnya kontinyu.
- Permasalahan lain – ukuran tertentu.

Aplikasi dari klasterisasi diantaranya adalah:

1. Market Segmentation:

Tujuan : Membagi pasar kedalam sub-set pelanggan yang berbeda, dimana suatu sub-set                              mungkin dapat dipilih sebagai terget pasar yang dicapai dengan satu kombinasi                                pemasaran yang berbeda.

Pendekatan:
  • Kumpulkan atribut dari pelanggan yang berbeda berdasarkan pada informasi                                   tempat tiggal dan gaya hidup
  • Tentukan klaster dari pelanggan-pelanggan yang sama.
  • Hitung kualitas klaster dengan mengobservasi pola daya beli pelanggan pada klaster yang samaversus dari klaster yang berbeda.

2. Document Clustering:


Tujuan : Untuk mendapatkan kelompok dokumen yang mempunyai kesamaan berdasarkan pernyataan atau kata kata penting yang muncul dalam dokumen tersebut.
Pendekatan: Untuk mengenali kata kata yang sering muncul dalam tiap dokumen. Dari suatu pengukuran similaritas yang didasarkan pada frekuensi term yang berbeda. Gunakan pengukuran ini untuk  membentuk klaster-klaster.

Pencapaian : Information Retrieval dapat dimanfaatkan untuk menghubungkan suatu dokumen baru atau mencari term ke dokumen-dokumen yang diklaster

Sumber: Buku Data Mining

Kata Kunci : Klasterisasi Data Mining, data mining, clustering, skripsi teknik informatika, contoh skripsi, skripsi, contoh skripsi teknik informatika