FUZZY CLUSTERING




BAB 7 - FUZZY CLUSTERING

1. Tujuan [Kembali]
  • Mampu memahami konsep fuzzy logic clustering
  • Dapat menjalankan program dengan fuzzy clustering
2. Software [Kembali]
Software digunakan yaitu Software Matlab.



3. Dasar teori [Kembali]
Kemunculan fuzzy clustering dilatarbelakangi adanya masalah curse of dimensionality, yaitu jumlah rule yang begitu cepat membesar dengan bertambahnya jumlah variabel input FIS. Dengan fuzzy clusteriing, suatu data inpu-output akan dikelompokkan dalam beberapa grup atau cluster. Definisi sebuah rule diasosiasikan dengan suatu cluster data. Pembangunan FIS demikian bisa secara otomatis dilakukan menggunakan fungsi genfis2.

7.1 Fuzzy C-Means
Salah satu teknik fuzzy clustering adalah Fuzzy C-Means (FCM). Dalam teknik ini tiap data dikelompokkan dalam suatu cluster dengan derajat keanggotaan tertentu. Teknik ini di Implementasikan dalam fungsi fcm dimulai dengan tebakan awal tentang pusat dari cluster. Fungsi fcm  dibangun dari tiga fungsi lain yaitu: 
  • initfcm berfungsi sebagai yang melakukan inisialisasi masalah
  • distfcmberfungsi sebagai yang menghitung jarak titik data terhadap pusat cluster
  • stepfcm berfungsi sebagaiyang melakukan iterasi algoritma clustering
Tiap titik data akan diberikan suatu derajat keanggotaan terhadapat cluster tebakan. Fungsi fcm kemudian secara interaktif memperbarui pusat-pusat cluster dan juga derajat keanggotaan tiap titik data sampai sedekat mungkin dengan pusat-pusat cluster yang "benar".
Berikut ini adalah command lines untuk membuat plot semua data sesuai dengan tempat dia berada, dalam cluster#1 atau cluster#2 : 

maxU = max (U) ;
index1 = find(U(1,:)== maxU);
index2 = find(U(2,:)== maxU);
plot(fcmdata(index1, 1), fcmdata(index1, 2), 'linestyle',...
'none', marker', 'o','color'. 'r');
plot(center(1,1), center (1,2),'ko' ,'markersize',15,...
'linewidth',2)
plot(center(2,1),center(2,2),'kx','marlersize',15,...
'linewidth',2)
hasil dari clustering dengan fcm





7.2 Substractive Clustering
Kelemahan dari fungsi fcm adalah mengamsumsikan jumlah cluster yang sudah diketahui sebelumnya, padahal seringkali kita sulit menebak jumlah cluster dalam data. Jika kita tidak mengetahui jumlah cluster yang pasti pada sekumpulan data, kita bisa menerapkan teknik substractive clustering.

Fuzzy Logic Toolbox mengimplementasikan teknik ini dalam fungsi genfis2. Fungsi ini mempunyai algoritma yang "sekali jalan" dan cepat dalam meentukan jumlah cluster dan juga pusat-pusatnya.

7.2.1  Contoh aplikasi
Fuzzy logic toolbox sudah menyediakan data yang bisa dipakai untuk mengilustrasikan aplikasi teknik substractive clustering. Data dapat diambil dengan mengekseksi file tripdata.m. Fungsi genfis2 adalah membangun FIS tanpa melalui iterasi, sehigga bisa dengan cepat menemukan posisi-posisi custer yang "benar" dengan jumlah seminimum mungkin.
 
7.2.2  Analisis Overfitting 
Overfitting merupakan keadaan dimana model berusaha untuk mempelajari seluruh detail termasuk noise yang ada dalam data dan berusaha untuk mengikutsertakan semua data point ke dalam garis.
Di gambar ini, garis justru tidak mengenai data point manapun seperti bergerak tidak sesuai data yang ada. Model ini tidak menangkap tren dari dataset yang berarti tidak mempelajari pola dari data. Model yang terlalu sederhana berakibat pada model yang tidak bergantung data dan cenderung melakukan asumsi terhadap data. Contohnya model ini berasumsi bahwa datanya linear, padahal ini sama sekali tidak benar. Ketika model melakukan prediksi, prediksi yang dihasilkan akan tidak akurat karena model gagal mempelajari data.
 
7.2.3  Clustering Tool
Masalah clustering adalah masalah yang berdiri sendiri, tidak harus berkaitan dengan masalaha permodelan dan pelatihan dengan anfis. Fungsi genfis2 menggunakan teknik sustractive clstering sebagai metode intinya.
 
Fuzzy logic Toolbox mengimplementasikan teknik clustering dalam dua mode yaitu dengan menggunakan command lines dan GUI. Contoh dalam mode command lines adalah fungsi fcm dan subclust. Fungsi subclust adalah fungsi yang terdapat dalam data dan juga menentukan pusat-pusat cluster. Fungsi ini merupakan fungsi inti dalam implementasi genfis2. Sintaks pemakaian subclust adalah
[centers] = subclust(X,radius)
 
dimana X adalah matriks data berdimensi M-by-N dan radius adalah radius cluster yang diinginkan. Keluaran fungsi ini adalah centers yang berisi pusat-pusat cluster yang ada dalam data X.
 
Dalam mode GUI terdapat clustering GUI Tool, yang dipanggil dengan perintah findcluster dan diperlihatkan seperti pada gambar dibawah ini 

Dalam GUI ini terdapat opsi metode subsatractive clustering, juga metode FCM. GUI ini bisa dipanggil dengan langsung loading data.

4. Video [Kembali]

Video Teori dari youtube

Video simulasi matlab dari contoh di buku

5. Download [Kembali]

 


Tidak ada komentar:

Posting Komentar