loading...

Sabtu, 06 Januari 2018

Matlab Metode Data Mining (K-NN)

Menurut wikipedia diterangkan sebagai berikut
Algoritma k-nearest neighbor (k-NN atau KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut.

Data pembelajaran diproyeksikan ke ruang berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi data pembelajaran. Sebuah titik pada ruang ini ditandai kelas c jika kelas c merupakan klasifikasi yang paling banyak ditemui pada k buah tetangga terdekat titk tersebut. Dekat atau jauhnya tetangga biasanya dihitung berdasarkan jarak Euclidean.
https://id.wikipedia.org/wiki/KNN
Anda bisa mengunjungi link berikut mengenai perhitungan dan langkah-langkahnya


http://www.scholarpedia.org/article/K-nearest_neighbor
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2243774/?page=1
https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+(Original)
http://me.seekingqed.com/files/intro_KNN.pdf
http://dataaspirant.com/2016/12/23/k-nearest-neighbor-classifier-intro/
untuk lebih jelasnya di
http://people.revoledu.com/kardi/tutorial/KNN/KNN_Numerical-example.html

Persiapan Data

Agar lebih mudah memahami, saya sediakan contoh. Didapatkan sebuah hasil mengenai sebuah survey mengenai kualitas jenis tisu yaitu bagus dan jelek yang didasarkan pada 2 paramater yaitu tingkat keasamaan dan kekuatan mudah robek

Perusahaan ingin membuat tisu dengan karakteristik X1= 3, dan X2 = 7, termasuk manakah jenis tersebut? Berdasarkan informasi mengenai table diatas?

Normalisasi Data

Tentu kita harus mengubah data diatas untuk bisa dipahami oleh komputer dengan mengubah good menjadi bernilai 1 dan bad menjadi 0.
Lebih mudah jika kita simpan dalam bentuk excel seperti berikut disimpan dengan nama data latih.xlsx

Code Matlab

Berikut kode dan function yang digunakan didalam matlab yaitu classify

clc;clear all;close all;
[data,header] = xlsread('data latih.xlsx');
X1 = 3;
X2 = 7;
test = [X1 X2];
hasil =classify(test,[data(:,1),data(:,2)],data(:,3));
if hasil==1
    disp(['good']);
else 
    disp(['bad']);
end

menghasilkan

good
 

Cukup mudah bukan?
Bila kita membuat dalam versi GUI akan menjadi mudah seperti berikut






Tidak ada komentar: