K-Means Clustering adalah suatu metode penganalisaan data atau metode Data Mining yang melakukan proses pemodelan tanpa supervisi (unsupervised) dan merupakan salah satu metode yang melakukan pengelompokan data dengan sistem partisi. Ada dua jenis data clustering yang sering dipergunakan dalam proses pengelompokan data yaitu Hierarchical dan Non-Hierarchical. K-Means sendiri merupakan salah satu metode data clustering non-hierarchical atau Partitional Clustering.

Metode K-Means Clustering berusaha mengelompokkan data yang ada ke dalam beberapa kelompok, dimana data dalam satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan mempunyai karakteristik yang berbeda dengan data yang ada di dalam kelompok yang lain. Dengan kata lain, metode K-Means Clustering bertujuan untuk meminimalisasikan objective function yang diset dalam proses clustering dengan cara meminimalkan variasi antar data yang ada di dalam suatu cluster dan memaksimalkan variasi dengan data yang ada di cluster lainnya.

Pada kesempatan ini saya akan menyampaikan Langkah-langkah Algoritma K-Means secara umum yaitu sebagai berikut:
  1. Tentukan jumlah cluster.
  2. Tentukan centroid awal dari tiap cluster (Using Lower and Upper bounds or Randomly).
  3. Alokasikan data dengan jumlah cluster yang ditentukan berdasarkan jarak terdekan dengan centroid (menggunakan rumus Ecludien distance space atau Manhattan / City Block distance space).
  4. Setelah cluster dan anggotanya terbentuk, hitung mean tiap cluster dan jadikan sebagai centroid baru.
  5. Kembali ke-3 apabila masih terdapat perpindahan data dari satu cluster ke cluster yang lain, atau apabila perubahan pada nilai centroid masih diatas nilai threshold yang ditentukan.
Demikianlah Langkah-langkah Algoritma K-Means secara umum untuk penyelesaian pada studikasus dan semoga bermanfaat, terimakasih 😊

Post a Comment

Lebih baru Lebih lama