Tuesday, March 3, 2020

Buku Belajar Dasar-Dasar Statistika dengan R - Plot Grafik di R

Buku Belajar Dasar-Dasar Statistika dengan R - Plot Grafik di R

Sinopsis

Tidak lengkap rasanya kalau tidak membahas urusan grafik yang berguna untuk memvisualisasikan dataset. Grafik di R secara default mempunyai beragam jenis plot yaitu
  1. Line
  2. Scatterplots
  3. Bar
  4. Histograms
  5. Pie
Merupakan base grafik plot yang sudah ada secara default di R tanpa perlu kalian instal package tertentu. Walaupun grafiknya lumayan sederhana tapi hal ini sudah sangat cukup untuk visualisasikan data dengan baik dengan cepat.



Grafik Line

Merupakan jenis grafik berbentuk titik yang dihubungkan oleh garis-garis, dengan function umumnya yaitu

plot(v,type,col,xlab,ylab)

  • v  : variabel berbentuk vector
  • type : jenis plot yaitu  p-point, I-line, o-jenis plot line dan point
  • xlab : label sumbu x
  • ylab : label sumbu y
  • main : judul
  • col  : warna/color

Contoh penggunanaan grafik plot

# data penjualan
x <- c(40,23,10,5,6,9)

# grafik line
plot(x,type = 'o', col = 'red', xlab = 'hari ke ', ylab = 'penjualan', main = 'Data penjualan komoditas beras')


Hasil

Buku Belajar Dasar-Dasar Statistika dengan R - Plot Grafik di R

Menggabungkan Grafik

Kalian juga bisa menggabungkan 2 grafik menjadi satu agar terlihat hasilnya menggunakan perintah \(lines()\) dengan bentuk perintahnya yaitu

lines(v, type, col)

Contoh penggunaan perintah \(line()\)

# data penjualan
x  <-c(40,23,10,5,6,9)
x2 <-c(12,20,8,9,10,20)
# grafik line
plot(x,type = 'o', col = 'red', xlab = 'hari ke ', ylab = 'penjualan', main = 'Data penjualan komoditas beras')
lines(x2,type = 'o', col = 'blue')

Buku Belajar Dasar-Dasar Statistika dengan R - Plot Grafik di R

Membuat Legend 

Kalian bisa menambahkan informasi grafik seperti \(legend()\) dengan perintah umumnya yaitu

legend(x, y=NULL, legend, fill, col, bg)

  • x and y : lokasi x dan y posisi legend
  • legend : informasi legend
  • fill : pengaturan legend seperti color box, line box
  • col : pengaturan warna
  • bg : warna background

Contoh penggunaannya

# data penjualan
x  <-c(40,23,10,5,6,9)
x2 <-c(12,20,8,9,10,20)
# grafik line
plot(x,type = 'o', col='red',xlab = 'hari ke ', ylab = 'penjualan', main = 'Data penjualan komoditas beras')
lines(x2,type = 'o',col='blue')
legend(2,35, legend=c('IR-64', 'IR-32'),col=c('red', 'blue'),lty=1:2, cex=0.8,)

Buku Belajar Dasar-Dasar Statistika dengan R - Plot Grafik di R

Grafik Scatterplots

Grafik jenis ini biasa disebut dengan diagram sebar/tebar digunakan untuk melihat sebaran data sehingga membutuhkan pasangan 2 data/sumbu yaitu x dan y. Bentuk umum scatter sama dengan line hanya saja ditambah argument y

plot(x, y, main, xlab, ylab, xlim, ylim, axes)

  • x  : variabel berbentuk vector pada sumbu x
  • y  : variabel berbentuk vector pada sumbu y
  • xlab : label sumbu x
  • ylab : label sumbu y
  • main : judul
  • xlim : batasan nilai sumbu x
  • ylim : batasan nilai sumbu y

Sekalian yuk setelah kalian pelajari https://www.softscients.web.id/2020/03/dataset-default-di-r.html, kita coba loading dataset yaitu iris

data(iris)
head(iris,4)
plot(iris$Sepal.Length,iris$Petal.Length,main='Iris data')

hasil

  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa

Buku Belajar Dasar-Dasar Statistika dengan R - Plot Grafik di R

Sayangnya sih tidak bisa kalian gabungkan 2 scatter menjadi satu (kalian butuh library ggplot) sehingga kalian bila ingin melihat sebaran Species yaitu iris, versicolor, virginica harus dilakukan satu persatu seperti pembahasan selanjutnya.

Menampilkan Beberapa Grafik Sekaligus

Untuk menampilkan beberapa plot sekaligus, misalkan disusun menjadi 3 kolom menggunakan perintah

par(mfrow= c(nrows, ncols)

Dengan c adalah vector yang berisi informasi susunan plot, mari kita buat sebaran data pada Species yaitu iris, versicolor, virginica  (oiya kalian harus pelajari mengenai slicing data frame) kalau belum paham cara menyeleksi data frame berdasarkan indexnya

data(iris)
par(mfrow=c(1,3))
plot(iris$Sepal.Length[iris$Species=='setosa'],iris$Petal.Length[iris$Species=='setosa'],xlab='sepal',ylab='petal',col='red',main='Iris data Setosa')
plot(iris$Sepal.Length[iris$Species=='versicolor'],iris$Petal.Length[iris$Species=='versicolor'],xlab='sepal',ylab='petal',col='green',main='Iris data Versicolor')
plot(iris$Sepal.Length[iris$Species=='virginica'],iris$Petal.Length[iris$Species=='virginica'],xlab='sepal',ylab='petal',col='blue',main='Iris data Virginica')

 


Buku Belajar Dasar-Dasar Statistika dengan R - Plot Grafik di R

Grafik Bar

Jenis grafik ini digunakan untuk membandingkan ketinggian/nilai jenis, dengan bentuk function umumnya yaitu

barplot(H, names.arg,xlab,ylab,main,col)

  • H  : variabel berbentuk vector
  • names.arg: keterangan bar
  • xlab : label sumbu x
  • ylab : label sumbu y
  • main : judul
  • col  : warna/color
Contoh kita akan menggambarkan volume penjualan merk air minum mineral

# data penjualan
penjualan <- c(40,23,10,12,20)
produk <-c('aqua','vit','le minerale','club','pure life')
barplot(penjualan,names.arg = produk,xlab='produk',ylab='penjualan',col='blue',main='Penjualan AMDK',border='black')

Buku Belajar Dasar-Dasar Statistika dengan R - Plot Grafik di R

Grafik Stacking Bar

Stacking bar bisa kalian gunakan dengan melibatkan matrix, contohnya kita ingin membandingkan penjualan air minum di 2 toko.

toko <- c('Giant','Indomaret')
colors = c('green','orange')
penjualan <- matrix(c(40,23,10,12,20,35,20,5,17,18),nrow=2,ncol=5)
produk <-c('aqua','vit','le minerale','club','pure life')
barplot(penjualan, main = 'Penjualan AMDK di Toko', names.arg = produk, xlab = 'produk', ylab = 'penjualan', col = colors)
legend('topright', toko, cex = 1.2, fill = colors)

Buku Belajar Dasar-Dasar Statistika dengan R - Plot Grafik di R

Nah kalau ini sangat terlihat jelas, misalkan Aqua penjualan terbesar di toko Giant, sedangkan penjualan le minerale terbesar ada di toko indomaret.

Grafik Histograms

Jenis grafik ini mempunyai tampilan seperti Bar hanya saja berbeda tujuannya yaitu untuk melihat frekuensi kemunculan setiap data. Misalkan kalian punya data berikut

x = c(1,1,1,2,3,3,2,1,5)

Untuk menghitung jumlah kemunculan angka 1,2,3,4,5 maka gunakan perintah table

table(x)

Hasil

x
1 2 3 5 
4 2 2 1

Artinya angka 1 muncul sebanyak 4 kali, angka 2 muncul sebanyak 2 kali dan seterusnya. Biasanya grafik frekuensi digunakan untuk melihat sebaran/jenis distribusi data, misalkan dipakai dalam analisis gugus kendali mutu mengenai produk yang mengalami kecacatan, uji sampling pada proses produksi. Function umum untuk histogram yaitu

hist(v,main,xlab,ylab,xlim,ylim,breaks,col,border)
  • v  : variabel berbentuk vector
  • main : judul
  • names.arg: keterangan bar
  • xlab : label sumbu x
  • ylab : label sumbu y
  • col  : warna/color
  • border: warna tepi
  • xlim : batasan nilai sumbu x
  • ylim : batasan nilai sumbu y
  • breaks: untuk menentukan lebar
Kita coba saja histogramnya seperti dibawah ini, xlim = c(1,5) mengikuti jumlah rentang nilai 1 sampai dengan 5, ylim = c(0,4) mengikuti jumlah frekuensi yang muncul dari 0 sampai 4.

x = c(1,1,1,2,3,3,2,1,5)
hist(x,xlab = 'nilai',ylab='frekuensi',col = 'yellow',border = 'black',xlim = c(1,5),ylim = c(0,4),main='Histogram X')

Buku Belajar Dasar-Dasar Statistika dengan R - Plot Grafik di R

Grafik Phi

Grafik Pie biasa digunakan untuk memvisualisasikan proporsi objek dalam skala persentase dengan bentuk umum

pie(x, labels, radius, main, col, clockwise)

  • x  : variabel berbentuk vector
  • main : judul
  • labels: keterangan
  • col  : warna/color
  • clockwise : opsi untuk mengindikasikan visualisasi searah jarum jam atau sebaliknya.
Contoh penggunaannya
    x <- c(21, 62, 10, 53)
    labels <- c('SMA','S1','S2','S3')
    
    pie(x, labels, main ='Proporsi Data Pengunjung', col = rainbow(length(x)))
    
    legend('topright', labels, cex = 0.8,  fill = rainbow(length(x)))
    

    Sangat terlihat bahwa pengunjung paling banyak adalah S1

    Buku Belajar Dasar-Dasar Statistika dengan R - Plot Grafik di R 

    Demikian pembahasan Buku Belajar Dasar-Dasar Statistika dengan R - Plot Grafik di R yang tidak perlu menggunakan package karena sudah ada default. Sedangkan bagi kalian yang ingi menampilkan beragam grafik yang menarik dan canggih bisa belajar dulu mengenai package seperti ggplot, plotly agar tampilannya seperti visualisasi di sinopsis.


    No comments:

    Post a Comment