Thursday, February 27, 2020

Buku Belajar Dasar-Dasar Statistika dengan R-Data Terstruktur Vector - Matrix - List dan Data Frame

Buku Belajar Dasar-Dasar Statistika dengan R-Data Terstruktur Vector - Matrix dan Data Frame

Sinopsis

Data terstrukur merupakan suatu set variabel yang dijadikan satu kesatuan. Sama seperti dengan bahasa pemrograman umum lainnya yang dilengkapi dengan data tersetrukur maka di R pun ada juga malah lebih mudah dalam penggunaanya yaitu
  1. Vector
  2. Matrix
  3. List
  4. Data Frame
Dengan 3 jenis data tersebut sangat mampu melakukan pengolahan bermacam-macam sumber jenis dataset seperti CSV, excel dan lainnya.

VECTOR

Vector adalah array dalam yang terdiri dari 1 barus saja yaitu ntuk mengumpulkan sebuah nilai menjadi satu kesatuan menggunakan perintah \(c())\). Untuk mengakses indexnya menggunakan operator [] yang dimulai dengan index no 1. Misalkan seperti berikut ini

Contoh kode penggunan vector pada bahasa R

daftar_nama= c('bejo','bagus','pamungkas')
print(daftar_nama)

Hasil

[1] "bejo"      "bagus"     "pamungkas"

Akses Vector

Untuk akses vector seperti berikut, misalkan untuk akses no 1 dan 3.

Contoh kode penggunan akses vector pada bahasa R

print(daftar_nama[1])
print(daftar_nama[3])

Hasil

[1] "bejo"
[1] "pamungkas"

Selain mempermudah dalam pengelolaan variabel, bisa kalian gunakan untuk operasi sederhana seperti \(sum\) bila variabel tersebut berisi numeric. Contoh lainnya yaitu

Contoh kode penggunan operasi vector pada bahasa R

a = c(1,3,4,90,45)
total = sum(a)
print(a)
print(total)

Hasil

[1]  1  3  4 90 45
[1] 143

Sedangkan untuk array yang terdiri dari baris dan kolom disebut dengan matrix.

MATRIX

Array 2D yaitu terdiri dari baris dan kolom yang disebut dengan Matrix. Matrix ini akan berguna sekali ketika kalian bekerja pada sistem persamaan matematika. Membuat Matrix di R sangat mudah koq bisa dilakukan dengan reshape sebuah vector menjadi matrix seperti berikut
$$A=
\begin{pmatrix}
  1 & 2 & 4 \\
  9 & 12 & 3\\
\end{pmatrix}
$$

Contoh kode penggunan matrix pada bahasa R

data = matrix(c(1,2,4,9,12,3),nrow=2,ncol=3,byrow=TRUE)
print(data)

Hasil

     [,1] [,2] [,3]
[1,]    1    2    4
[2,]    9   12    3

Dimensi matrix

Untuk mengetahui sebuah dimensi matrix gunakan perintah \(dim\) yaitu terdiri dari baris dan kolom

Contoh kode penggunan dimensi matrix pada bahasa R

dimensi = dim(data)
dimensi[1] #jumlah baris
dimensi[2] #jumlah kolom

Hasil

[1] 2
[1] 3

Akses pada kolom dan baris tertentu

Akses pada sebuah matrix sama seperti dengan vector, misalkan untuk akses baris 2 kolom 3

Kode

data[2,3]

Hasil

[1] 3


sedangkan kalau mau akses seluruh kolom pada baris 2 gunakan tanda \(:\)

Contoh kode akses index matrix pada bahasa R

data[2,1:3] # atau
data[2,]

Hasil

[1]   9  12 100
[1]   9  12 100


Mengubah isi matrix

Kalau untuk mengubah value baris 2 kolom 3, seperti  berikut

Contoh kode mengubah isi matrix pada bahasa R

data[2,3]=100
print(data)

Hasil

     [,1] [,2] [,3]
[1,]    1    2    4
[2,]    9   12  100

List

Jenis data list merupakan jenis vector yang mempunyai sebuah nama/key. Misalkan kalian punya data KTP yang mempunyai informasi mengenai nama,  tanggal lahir, pekerjaan yang disebut dengan key. Untuk mempresentasikan tersebut digunakanlah list, oiya untuk membuat key harus mengikuti kaidah berikut
  1. tidak boleh didahului dengan angka
  2. tidak boleh mengandung spasi
  3. tidak boleh mengandung tanda simbol seperti $

Membuat List

Contoh berikut untuk membuat list KTP yang terdiri dari nama, tanggal, dan pekerjaan

bintang<-list('nama'='bintang pamungkas','tanggal'='4 juni 1988','pekerjaan'='akuntan')
print(bintang)

Hasil


$nama
[1] "bintang pamungkas"

$tanggal
[1] "4 juni 1988"

$pekerjaan
[1] "akuntan"

Akses List menggunakan Key

Untuk akses key nya harus menggunakan tanda $ atau []. Contoh untuk akses nama

print(bintang$nama)
print(bintang['nama'])

Hasil

> print(bintang$nama)
[1] "bintang pamungkas"
> print(bintang['nama'])
$nama
[1] "bintang pamungkas"

Mengubah Isi List menggunakan Key

Tapi penulis lebih suka menggunakan tanda $ saja, oiya untuk mengubah isi value nya pun sama, dengan cara menggunakan akses tanda $

bintang$nama='sri bintang pamungkas'

print(bintang$nama)

Hasil

[1] "sri bintang pamungkas"


Data Frame

Kalau kalian terbiasa bekerja dengan excel yang tersusun atas baris, kolom, dan header yang mempermudah kalian dalam melakukan seleksi kolom tertentu saja yang bila menggunakan R tools dinamakan Data Frame bila kalian menggunaan Matlab disebut dengan table, kalau untuk Python kalian menggunakan Library.

Membuat Data Frame dari vector

Untuk membuat data frame ada 2 yaitu dari menggambungkan vector dan loading file.  Perintah membuat data frame yaitu \(data.frame\). Misalkan kalian ingin membuat data frame berikut

Data Terstruktur Vector - Matrix dan Data Frame


Contoh kode pembuatan data frame dari menggabungkan vector

no = c(1:5)
item = c('radio','monitor','antena','keyboard','kabel')
terjual = c(100,200,234,300,230)
data = data.frame(no,item,terjual)
print(data)

Hasil

  no     item terjual
1  1    radio     100
2  2  monitor     200
3  3   antena     234
4  4 keyboard     300
5  5    kabel     230

Menampilkan informasi head

Bilakala kalian menjumpai data frame yang terdiri dari ribuan dataset, maka untuk menampilkan beberapa baris data frame gunakan perintah \(head()\), seperti contoh berikut untuk menampilkan 3 baris saja

Kode

head(data,3)

Hasil

  no    item terjual
1  1   radio     100
2  2 monitor     200
3  3  antena     234

Memilih Variabel / kolom tertentu

Adakalanya kalian dalam hanya ingin mendapatkan kolom tertentu saja, misalkan hanya ingin mendapatkan kolom terjual, kalian bisa gunakan perintah \(data$variabel\).

Kode

data$terjual

Hasil

[1] 100 200 234 300 230

Summary

Bahkan dengan memanggil perintah \(summary()\) kalian mendapatkan informasi statistik deskriptif seperti berikut

Kode

summary(data)

Hasil

      no          item      terjual     
 Min.   :1   antena  :1   Min.   :100.0  
 1st Qu.:2   kabel   :1   1st Qu.:200.0  
 Median :3   keyboard:1   Median :230.0  
 Mean   :3   monitor :1   Mean   :212.8  
 3rd Qu.:4   radio   :1   3rd Qu.:234.0  
 Max.   :5                Max.   :300.0 


Informasi tipe variabel

Untuk mendapatkan tipe variabel tiap masing-masing kolom gunakan perintah \(str()\)

Kode

str(data)

Hasil

str(data)'data.frame': 5 obs. of  3 variables:
 $ no     : int  1 2 3 4 5
 $ item   : Factor w/ 5 levels "antena","kabel",..: 5 4 1 3 2
 $ terjual: num  100 200 234 300 230


Oleh : Devi Nurtiyasari

No comments:

Post a Comment