Saturday, January 6, 2018

buku belajar machine learning dengan matlab - Klasifikasi Dataset dengan KNN


Seiring dengan meningkatnya traffic dan kemudahan dalam mengelola content, kami mengucapkan banyak terima kasih kepada para pembaca setia pada blog www.softscients.web.id

Per 19 Maret 2020, kami sedang melakukan migrasi ke domain dan hosting yang lebih baik yaitu
Semoga dengan alamat domain dan hosting terbaru akan semakin memudahkan para pembaca dalam mencari materi/content. Migrasi dilakukan secara bertahap yang membutuhkan waktu yang cukup lama jadi jangan kuatir selama migrasi akan dilakukan secara hati-hati untuk memimalkan broken link

Kalian bisa lanjut baca lagi di  http://softscients.com/2020/03/26/buku-belajar-machine-learning-dengan-matlab-klasifikasi-dataset-dengan-knn/


Sinopsis

Menurut wikipedia diterangkan sebagai berikut: Algoritma k-nearest neighbor (k-NN atau KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut.Data pembelajaran diproyeksikan ke ruang berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi data pembelajaran. Sebuah titik pada ruang ini ditandai kelas c jika kelas c merupakan klasifikasi yang paling banyak ditemui pada k buah tetangga terdekat titk tersebut. Dekat atau jauhnya tetangga biasanya dihitung berdasarkan jarak Euclidean. Ref: https://id.wikipedia.org/wiki/KNN,  Kalian bisa mengunjungi link berikut mengenai perhitungan dan langkah-langkahnya

  1. http://www.scholarpedia.org/article/K-nearest_neighbor
  2. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2243774/?page=1
  3. https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+(Original)
  4. http://me.seekingqed.com/files/intro_KNN.pdf
  5. http://dataaspirant.com/2016/12/23/k-nearest-neighbor-classifier-intro/
  6. untuk lebih jelasnya di http://people.revoledu.com/kardi/tutorial/KNN/KNN_Numerical-example.html

Persiapan Data

Agar lebih mudah memahami, saya sediakan contoh. Didapatkan sebuah hasil mengenai sebuah survey mengenai kualitas jenis tisu yaitu bagus dan jelek yang didasarkan pada 2 paramater yaitu tingkat keasamaan dan kekuatan mudah robek

Perusahaan ingin membuat tisu dengan karakteristik X1= 3, dan X2 = 7, termasuk manakah jenis tersebut? Berdasarkan informasi mengenai table diatas?

Normalisasi Data

Tentu kita harus mengubah data diatas untuk bisa dipahami oleh komputer dengan mengubah good menjadi bernilai 1 dan bad menjadi 0.
Lebih mudah jika kita simpan dalam bentuk excel seperti berikut disimpan dengan nama data latih.xlsx

Code Matlab

Berikut kode dan function yang digunakan didalam matlab yaitu classify

clc;clear all;close all;
[data,header] = xlsread('data latih.xlsx');
X1 = 3;
X2 = 7;
test = [X1 X2];
hasil =classify(test,[data(:,1),data(:,2)],data(:,3));
if hasil==1
    disp(['good']);
else 
    disp(['bad']);
end

menghasilkan

good 

Cukup mudah bukan?
Bila kita membuat dalam versi GUI akan menjadi mudah seperti berikut






No comments:

Post a Comment