Rabu, 24 Januari 2018

Compute Confusion matrix

Confusion matrix merupakan salah satu metode yang dapat digunakan untuk mengukur kinerja suatu metode klasifikasi. Pada dasarnya confusion matrix mengandung informasi yang membandingkan hasil klasifikasi yang dilakukan oleh sistem dengan hasil klasifikasi yang seharusnya

TN : merupakan data negatif yang terdeteksi dengan benar
FP : merupakan data negatif namun terdeteksi sebagai data positif
TP: merupakan data positif terdeteksi benar
FN :merupakan data positif terdeteksi sebagai data negatif

Jumat, 12 Januari 2018

Classification with Support Vector Machines - Linear Data

[Teori]

SVM adalah algoritma supervisi untuk melakukan klasifikasi baik linear maupun nonlinear tergantung pada margin maksimalisasi diantara titik suporrt, mapping data dapat ditransformasi kedalam dimensi yang lebih tinggi. SVM dibangun oleh Vapnik dan Cortes pada 1992, SVM telah sukses diaplikasikan kebanyak kasus seperti pengenalan tulisan tangan, prediksi runtun waktu, pengenalan suara
Implementasi Support Vector Machine
Pada tulisan ini akan diberikan mengenai
1.    Cara training SVM
2.    Mengukur kinerja nya
3.    Prediksi hasil klasifikasi dengan menggunakan data asing (data yang belum pernah digunakan untuk pelatihan)
Karena tulisan ini agak cukup panjang, siapkan waktu yang cukup!

Minggu, 07 Januari 2018

Matlab Clustering Data with Fuzzy C Means

Teori

Ide dasar dari clustering untuk untuk melakukan prediksi seperti halnya clasification, tapi lebih kepada mencoba untuk melakukan grouping terhadap beberapa item yang mirip sesuai dengan batas kondisi yang ada.
Contoh kasus grouping
  1. Grouping tipe dokumen dengan kemiripan bahasa (beberapa dokumen dijadikan 1 group bila ditemukan bahasa yang sama)
  2. Grouping artikel/berita yang sama

Sabtu, 06 Januari 2018

Matlab Metode Data Mining (K-NN)

Menurut wikipedia diterangkan sebagai berikut
Algoritma k-nearest neighbor (k-NN atau KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut.

Data pembelajaran diproyeksikan ke ruang berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi data pembelajaran. Sebuah titik pada ruang ini ditandai kelas c jika kelas c merupakan klasifikasi yang paling banyak ditemui pada k buah tetangga terdekat titk tersebut. Dekat atau jauhnya tetangga biasanya dihitung berdasarkan jarak Euclidean.
https://id.wikipedia.org/wiki/KNN
Anda bisa mengunjungi link berikut mengenai perhitungan dan langkah-langkahnya

Senin, 11 Desember 2017

Matlab-Classification Learner Example Datasets

Berikut penulis sajikan dataset yang mungkin berguna untuk melakukan banyak ujicoba teknik classifier

Matlab-Image Dataset

Bila kita bekerja dengan menggunakan machine learnig, tentu kita membutuhkan  beragam dataset. Penulis sajikan link berikut untuk dataset image beberapa category

Jumat, 08 Desember 2017

Matlab-Which Algorithm to Machine Learning?

Ada banyak algoritma yang kita bisa gunakan untuk machine learning, seperti diagram berikut

Matlab-Supervised and Unsupervised Learning

Supervised Learning

The aim of supervised machine learning is to build a model that makes predictions based on evidence in the presence of uncertainty. A supervised learning algorithm takes a known set of input data and known responses to the data (output) and trains a model to generate reasonable predictions for the response to new data.Supervised learning uses classifcation and regression techniques to develop predictive models.

Kamis, 07 Desember 2017

Matlab-How Machine Learning Works

Topik machine learning untuk saat ini sudah begitu berkembang pesat, selain keluwesan komputer dalam 'berpikir' seperti manusia, juga didukung oleh tersedianya data yang begitu melimpah. Teknik machine learning dibagi menjadi 2 yaitu

supervised learning, which trains a model on known input and output data so that it can predict future outputs, dan
unsupervised learning,which fnds hidden patterns or intrinsic structures in input data.

Berikut diagram machine learning

Sharp Develop mendukung WPF Application

Bagi anda yang suka dengan Sharp Develop untuk membuat aplikasi di platform Netframework, sekarang Sharp Develop sudah mencapai versi 5 dengan dukungan WPF Developing 5.1
http://www.icsharpcode.net/OpenSource/SD/Download/Default.aspx

Minggu, 03 Desember 2017

Sequence Matcher in python

Adalakanya kita membutuhkan pencocokan string dalam pengolahan data, misalkan untuk spelling karena user bisa saja melakukan kesalahan ejaan. Penulis biasa menggunakan Sequnce Matcher untuk melakukan hal demikian. Misalkan ada sebuah nama desa ‘Menjalin’ ketika user mengetikan ‘Mnjalin’ berapa nilai ratio kecocokannya?