Saturday, April 28, 2018

Python-Scraping Gambar menggunakan BeautifulSoup

Tulisan ini diambil dari situs berikut http://knowpapa.com/ yang mana digunakan untuk mengambil download gambar yang ada didalam sebuah folder situs (contohnya seperti ini https://code.google.com/p/tutorial-haartraining/) Kalian membutuhkan parser HTML yaitu BeautifulSoup, caranya install yaitu buka command prompt ketikan berikut


from BeautifulSoup import BeautifulSoup as bs
import urlparse
from urllib2 import urlopen
from urllib import urlretrieve
import os
import sys

def main(url, out_folder="D:/download/"):
    if os.path.exists(out_folder)==False:
        os.mkdir(out_folder)  
    soup = bs(urlopen(url))
    i = 0
    for image in soup.findAll("a"):
        parsed =  url+image['href']
        filename = image['href']
        outpath = os.path.join(out_folder, filename)
        try:
            urlretrieve(parsed, outpath)
        except:
            print "skipping" + parsed
        print i
        i = i +1
    print 'selesai cuy!'
if __name__ == "__main__":
    main("http://haar.thiagohersan.com/haartraining/negatives/")


Monday, April 16, 2018

Matlab-Algoritma Dynamic Time Warping

Kita sebut saja dengan DTW  (jangan kebalik dengan DWT) Dynamic time warping (DTW) adalah algoritma penyelarasan time series yang dikembangkan awalnya untuk pengenalan suara (1). Ini bertujuan menyelaraskan dua urutan vektor fitur dengan memutar sumbu waktu secara iteratif hingga kecocokan optimal (menurut metrik yang sesuai) antara dua urutan ditemukan.
Bagaimana mengukur tingkat jarak pada kasus diatas?
Sakoe,H. and Chiba, S. Dynamic programming algorithm optimization for spoken word recognition. IEEE Trans. on Acoust., Speech, and Signal Process., ASSP 26, 43-49 (1978).