Kata Pengantar
February 2, 2016
Softskill adalah suatu kemampuan, bakat, atau keterampilan yang ada di
dalam diri setiap manusia. Softskill adalah kemampuan yang dilakukan dengan
ara non teknis artinya tidak berbentuk atau tidak terlihat wujudnya. Namun,
softskill ini dapat dikatakan sebagai keterampilan personal dan inter personal.
sedangkan lawan katanya adalah HardSkill. Softskill dan Hardskill adalah 2 hal
yang saling melengkapi bagi seseorang dalam menggapai prestasi dan kinerja
gemilang.
Seorang lulusan perguruan tinggi dituntut untuk memiliki kompetensi hard
skill dan softskill. Kompetensi Hardskill merupakan penguasaan dan penggu-
naan ilmu pengetehuan dan teknologi. sedangkan kompetensi Softskill meru-
pakan kemampuan mengatur dirinya sendiri dan orang lain. dalam dunia kerja,
sebuah profesi dituntut memiliki hard skill yang berbeda-beda. Softskill meru-
pakan kompetensi yang seharusnya dimiliki oleh semua orang, apapun pro-
fesinya. oleh karena itu Universitas Gunadarma memasukan bahan kuliah tersendiri
untuk menunjang Softskill para mahasiswanya dengan membuat mata kuliah
softskill ini.
Pada kesempatan kali ini, kami akan membuat sebuah buku berkenaan den-
gan tugas mata kuliah Softskill dan akan mengangkat sebuah tema yaitu
Violing Plot - Gruped violinplots with split violins . Buku ini dibuat oleh
kami untuk memenuhi tugas mata kuliah Softskill pada kampus kami. Kami
berharap buku ini dapat berguna dan bermanfaat dalam menambah wawasan
serta pengetahuan kita mengenai tema yang akan kami angkat kali ini. kami
juga menyadari sepenuhnya bahwa di dalam buku ini terdapat kekurangan dan
jauh dari kata sempurna. oleh sebab itu, kami berharap adanya kritik, saran
dan usulan demi memperbaiki buku yang telah kami buat di masa yang akan
datang, mengingat tidak ada sesuatu yang sempurna tanpa saran yang mem-
bangun.
Kami juga mengu
apkan puji syukur kehadirat Tuhan yang Maha Esa karena
dengan rahmat, karunia, serta tau k dan hidayatnya buku ini dapat selesai tepat
waktu. dan juga kami berterima kasih kepada Bapak Dr. rer. nat. I MADE
WIRYANA, SSI,SKOM,MS
selaku dosen mata kuliah Softskill Universitas Gu-
nadarma yang telah memberikan tugas ini kepada kami.
Semoga buku ini dapat dipahami bagi siapapun yang akan memba
anya.
Sebelumnya kami mohon maaf apabila ada kesalahan penulisan atau kalimat
yang kurang berkenan. Terima Kasih.
3
Depok, Januari 2016
Penyusun
Bab I
Pendahuluan
Violing Plot (Hintze dan Nelson, 1998) adalah metode meren
anakan data
numerik. Ini adalah sebuah box plot dengan diputar kepadatan kernel petak
disetiap sisinya.
Metode peren
anaan data numerik sudah sejak lama dikembangkan. Akan
tetapi, pada perkembangannya aplikasi metode tersebut dalam hal untuk menye-
lesaikan suatu permasalahan masih sangatlah jarang. Hal ini menyebabkan
karena alat bantu operasi perhitungan matematik seperti komputer masih san-
gatlah kurang. Semakin pesatnya perkembangan komputer, metode numerik
menjadi metode yang dipakai untuk menganalisa dan menyelesaikan masalah-
masalah yang terjadi di segala bidang ilmu. Akurasi perhitungan dari per-
masalahan se
ara matematis sangat bergantung pada asumsi-asumsi yang diberikan.
Masalah -masalah yang dapat diselesaikan oleh metode ini tidak hanya masalah
sederhana yang dapat diselesaikan se
ara analitik tetapi masalah kompleks pun
dapat diselesaikan oleh metode numerik tersebut. Pada Metode Numerik ini
sebuah permasalahan yang diformulasikan se
ara matematis merupakan suatu
pendekatan.
Violin Plot mirip dengan Box Plot, ke
uali bahwa mereka juga menunjukan
kepadatan probablitas dari data pada nilai yang berbeda ( dalam kasus yang
paling sederhana dapat menjadi sebuah Histogram ). Biasanya Violin Plot
akan men
akup penanda untuk median dari data yang tersedia dan kotak yang
akan menunjukkan kisaran interkuartilnya, seperti dalam plot kotak standart.
Overlay pada Box Plot ini adalah estimasi densitas kernel. Violoin Plot yang
tersedia sebagai ekstensi untuk sejumlah paket perangkat lunak, termasuk R
melalui vioplot, wvioplot,
aroline, UsingR, Library ggplot2, dan sebagainya.
Violin Plot juga
ukup mirip dengan sebuah gra k lobak yang digunakan di
dalam STATA.
Sebuah Violin Plot menunjukkan distribusi menggunakan lebar plot, yang
simetris pada porosnya. dalam R, vioplot () adalah perintah, yang akan di-
gunakan untuk membuat sebuah violin plot. sebuah Violin Plot memainkan
peran yang sama sebagai box dan whisker plot. ini menunjukan distribusi data
kuantitatif di beberapa tingkat satu (atau lebih) variabel kategori seperti itu
yang terdistribusi dapat dibandingkan. disebut sebagai Violin Plot karena gam-
bar gra k tersebut tampak seperti sebuah biola dengan lekukan lekukan yg
dibentuknya. Pada Violin Plot dapat menjadi sebuah
ara yang efektif dan
menarik untuk menampilkan beberapa distribusi data sekaligus atau berguan
untuk membandingkan distribusi, namun perlu diingat bahwa prosedur estimasi
4
dipengaruhi oleh ukuran sampel, dan Violin plot untuk sampel yang relatif ke-
il mungkin terlihat menyesatkan yang sangat halus. Violin Plots banyak yg
menggunakan menggunakan sebuah aplikasi R ataupun ggplots. Pada penggu-
naanya Violin Plots adalah gabungan dari dua plot yang berkesinambungan.
dan menghasilkan median dari suatu data numerik.
Bab II
Konsep Violing Plot - Gruped violinplots with split violins
Violin Plot adalah metode meren
anakan data numerik. ini adalah box plot
dengan diputar kepadatan kernel petak di seiap sisi. Violin Plot mirip dengan
box plot, ke
ulai bahwa mereka juga menunjukan probabilitasnya dari data pada
nilai yang berbeda (dalam kasus yang paling sederhana ini bisa menjadi sebuah
Histogram). Biasanya Plot Biola akan men
akup penanda untuk median dari
data dan kotak yang menunjukkan kisaran interkuartil, seperti dalam plot kotak
standar. Overlay pada Box Plot ini adalah Estimasi densitas kernel.
Violoin Plot yang tersedia sebagai ekstensi untuk sejumlah paket perangkat
lunak, termasuk R melalui vioplot, wvioplot,
aroline, UsingR, perpustakaan
ggplot2, stata melalui vioplot add in, dan phython serta matlab. Contoh gam-
bar dibawah ini adalah untuk menyelesaikan suatu permasalahan ilmiah pada
publikasi ilmiah di PLOS Pathogens.
5
Pada dasarnya, Gruped Violin Plot with Split Violin adalah sebuah Violin
Plot dengan penggabungan beberapa Violin Plot dengan menggunakan sebuah
split violin. dalam hal lain, yaitu menggabungkan beberapa masalah anali-
tik yang memiliki data akurat untuk menghasilkan suatu kesimpulan dengan
mengkombine kedua data tersebut menggunakan split violins. apa itu split vi-
olins? Split Violins adalah teknik pada Violin Plot untuk membagi- bagi atau
memisahkan suatu kepadatan pada sebuah data masalah yang akan dikerjakan.
Berikut adalah
ontoh gambar sebuah Gruped Violin Plot with split violin.
pada gambar Violin Plots - gruped violin plots with split violin diatas memakai
6
sebuah software phyton untuk membuatnya. dan untuk membuatnya menjadi
seperti gambar berikut menggunakan sour
e kode yaitu :
import seaborn as sns
sns.set(style= whitegrid , palette= pastel ,
olor_
odes=True)
#load the example tips dataset
tips = sns.load_dataset( tips )
# Draw a nested violinplot and split the violinsfor easier
omparison
sns.violinplot(x= day , y= total_bill , hue= sex , data=tips, split=True,
inner= quart , palette={ Male : b , female : y })
sns.despine(left=True)
Violin Plots di ggplot Jika pada
ontoh diatas menggunakan phyton,
kali ini software yang akan digunakan adalah paket ggplot2 di R. Siapa pun yg
menggunakannya mungkin akrab dengan geom_violin yang men
iptakan plot
biola. pemikiran tentang violin plot sebagai jalan lain dari densitas (yang pada
dasarnya sebuah histogram) . violin plot akan terlihat seperti ini
library ( ggplot2 ) ggplot (mt
ars, aes (x = fa
tor (
yl ), y=mpg , ll =fabtor
(
yl ))) + geom_violin ()
pada violin plot ini adalah sebuah teknik yang sangat berguna, karena ter-
lihat menunjukan bentuk distribusi dan memungkinkan mereka dengan mudah
memperkirakan modus dan jangkauan. Jika anda juga membutuhkan median
dan rentang interkuartil, itu sederhana untuk menampilkan mereka dengan over-
7
lay box plot (Violin Plot biasanya dibuat dengan
ara seperti ini).berikut adalah
beberapa
ontoh perbedaan antara beberapa plot
• Violin Plot (Plot Biola) dengan bar gra k
Violin Plot tidak terlalu populer dikalangan psikologi sastra, setidaknya diantara
kalangan visi/kognisi. sebaliknya, gra k batang lebih umum dan menyingkirkan
semua informasi yang tersedia di dalam Violin Plot.
library ( dplyr ) mt
arsSummary <- mt
ars %>% group_by (
yl ) %>%
summarize ( mpg_mean = mean ( mpg ), mpg_se = sqrt ( var (mpg) /
length (mpg)))
ggplot ( mt
arsSummary , aes ( x = fa
tor (
yl), y = mpg_mean,
ll = fa
tor (
yl))) + geom_bar (stat = identity )
Gra k batang menyoroti statistik tunggal memilih analis. Dalam Psikologi
dan bidang lainnya), peneliti menggunakan gra k batang untuk memvisualisas-
ikan mean dari data, dan biasanya men
akup bar kesalahan untuk menunjukan
kesalahan standar (atau interval keper
ayaan lain).
Namun, ketika akan melihat
aranya gra k batang, mereka akan menemukan
kesulitan menilai nilai-nilai yang tepat di dalam bar (yaitu dibawah rata - rata
) lebih mungkin dibandingkan sebagai nilai berjarak sama dari sebuah mean,
tetapi tetap diluar bar. Bias ini tidak mempengaruhi Violin Plot karena wilayah
di dalam Violin Plot berisi semua data yang diamati.
Mean dan Standart error adalah statistik yang hanya berguna bila seseorang
menganggap bahwa data yang biasa di distribusikan; gra k batang tidak mem-
8
bantu anda memeriksa asumsi tersebut. Untuk studi dalam kasus yang ke
il,
akan lebih efektif jika hanya meren
anakan setiap pengamatan tunggal.
• Violin Plot (Plot Biola) dan Density Plot
sebuah plot biola menunjukan kepadatan distribusi menggunakan lebar plot,
yang simestris pada porosnya, sementara plot kepadatan tradisional menggu-
nakan ketinggian dari dasar umum. Memungkinkan lebih mudah untuk diperki-
rakan perbedaan relatif dalam Density Plot, meskipun begitu yag terpenting
adalah Density Plot (atau histogram) siap menampilkan perkiraan kepadatan
(density), sedangkan Violin plot biasanya tidak hadir tersebut.
9
pada dasarnya, setiap plot memiliki setiap
ara masing masing untuk menampilkan
sebuah data dari suatu masalah analitik yg tersedia. jika pada gra s R, paket
vioplot dapat membuat Violin plot tanpa menggunakan ggplot2. seabornmun
ul
untuk membawa Violin Plot yg kuat untuk phyton.
ontoh kasus pada Violin Plot (Plot Biola) yaitu, ketika suatu data dikelom-
pokkan berdasarkan faktor dengan dua tingkat (misalnya laki-laki dan perem-
puan ). Anda dapat membagi dalam setengah Violin plot untuk melihat perbe-
daan antara kelompok 1 dan 2. dengan N = 1000.
ini akan memberi kita suatu perbandingan kasar distribusi masing masing
kelompok, dengan vioplot2() Violin plot akan dibuat. algoritmanya adalah
10
ini adalah tampilan hasil sour
e kode diatas
11
Violinplot.seaborn menggambarkan sebuah estimasi kepadatan boxplot
dan kernel.
pada violin plot, tidak seperti yg terdapat di boxplot, dimana semua kom-
ponen ren
ana sesuai dengan datapoints yang sebenarnya,plot biola memiliki
estimasi densitas kernel dari distribusi yang mendasariya. Hal ini dapat men-
jadi
ara yang efektif dan menarik untuk menampilkan beberapa distribusi data
seklaigus, namun perlu diingat bahwa prosedur estimasi dipengaruhi oleh uku-
ran sampel, dan Violin untuk sampel yang relatif ke
il mungkin terlihat mem-
bingungkan.
input data dapat dikirim dalam berbagai format, termasuk :
• Vektor data dipresentasikan sebagai daftar, array numpy, atau benda
panda series lulus langsung ke x y dan / atau hue parameter.
• Sebuah bentuk panjang Dataframe, dalam hal ini x y dan hue variabel
akan menentukan bagaimana data diplot.
• A wide-bentuk Dataframe, sehingga setiap kolom numerik akan di plot.
• Apapun yang diterima oleh plt.boxplot (misalnya array 2d atau daftar
vektor)
Dalam kebanyakan kasus memungkinkan untuk menggunakan sebuah numpy
atau phyton objek, tetapi pada objek panda lebih disukai karena nama-nama
12
yang terkait akan digunakan untuk membubuhi keterangan sumbu. selain itu,
dapat menggunakan sejumlah jenis katagori untuk variabel pengelompokan un-
tuk mengontrol urutan elemen plot.
13
Pengembalian :
14
Axes matplotlib: kapak
mengembalikan objek Axes dengan boxplot ke atasnya.
Ma
am-ma
am
ontoh plot dan kegunaannya:
Sebuah plot adalah teknik gra s untuk mewakili satu set data, biasanya sebagai
gra k yang menunjukkan hubungan antara dua variabel atau lebih. Plot dapat
ditarik dengan tangan atau oleh plotter mekanik atau elektronik. Gra k adalah
representasi visual dari hubungan antara variabel, sangat berguna bagi manusia
yang dapat dengan
epat memperoleh pemahaman yang tidak akan datang dari
daftar nilai. Gra k juga dapat digunakan untuk memba
a dari nilai variabel
yang tidak diketahui diplot sebagai fungsi dari satu dikenal. Gra k fungsi yang
digunakan dalam matematika, ilmu pengetahuan, teknik, teknologi, keuangan,
dan daerah lainnya.
Ikhtisar Plot memainkan peran penting dalam statistik dan analisis data.
Prosedur di sini dapat se
ara luas dibagi menjadi dua bagian: kuantitatif dan
gra s. Teknik kuantitatif adalah serangkaian prosedur statistik yang meng-
hasilkan keluaran numerik atau tabular. Contoh teknik kuantitatif meliputi
:
• uji hipotesa
• analisis varians
• estimasi titik dan interval keper
ayaan
• regresi kuadrat terke
il dan yang sejenis teknik semua berharga dan utama
dalamhal analisis klasik.
banyak juga terdapat alat statistik yang umumnya disebut teknik sebuah gra s.
yang diantaranya :
• plot pen
ar
• histogram
• kotak plot
• blok plot
• violin plot
• plot residual
• plot probabilitas
15
1.1 Jenis-jenis plot
• Countour Plot : sebuah plot dua dimensi yang menunjukan kurva satu
dimensi, yang disebut garis kontur yang kuantitasnya q diplot adalah kon-
stan. Opsional, nilai-nilai di plot dapat warna-kode
• Dalitz plot : ini adalah sebuah penyebaran yang sering digunakan dalam
sika partikel untuk mewakili frekuensi relatif dari berbagai (kinematik
yang berbeda)sopan santun dmana produk-produk dari peluruhan tiga-
tubuh tertentu mungkin bergerak terpisah
16
• Biplot: ini adalah jenis gra k yang digunakan dalam statistik. sebuah
biplot memungkinkan informasi pada kedua sampel dan variabel matriks
data yang akan ditampilkan se
ara gra s. sampel ditampilkan sebagai
poin sementara variabel ditampilkan baik sebagai vektor, sumu linier atau
non linier lintasan. Dalam kasus ini, poin tingkay variabel katagori da-
pat digunakan untuk mewakili variabel katagoris. sebuah biplot uum
menampilkan informasi pada kedua variabel kontinyu dan katagoris.
17
• Bland-Altman Plot: dalam kimia analitik dan biostatik plot ini adalah
metode data plotting yang digunakan dalam menganalisis perjanjian an-
tara dua tes yang berbeda. hal ini idntik dengan turkey rata-perbedaan
plot, yang masih dikenal dalam bigdang lain, tetapi dipopulerkan dalam
statistik medis oleh Bland and Altman.
18
• Arrhenius plot : plotini menampilkan logaritma dari tingkat yang (ln
(k), Ordinat axis) di plot terhadap suhu terbalik (1/ T, absis). Arhenius
plot sering digunakan untukmenganalisa pengaruh suhu terhadap tingkat
reaksi kimia.
• Dot plot (bioinformatika): sebuah titik plot metode grafs yang memu-
ngkinkan perbandingan dua sekuens biologis dan mengidenti kasi daerah
kemiripan antara mereka. Ini adalah suatu jenis plot kekambuhan.
sebuah DNA dot plot faktor transkrip zin
nger manusia(GenBank ID NM_002383),menunjukan
kemiripan-diri daerah. diagonal utama merupakan keselarasan urutan dengan
dirinya sendiri; gra s o dagonal utama merupakan pola yang sama atau beru-
lang dalam urutan.
19
• Dot plot (statistik): Sebuah titik gra s yang menunjukan kekuatan bukti
dalam studi ilmiah kuantitatif. ini dikembangkan untuk digunakan dalam
penelitian medis sebagai sarana gra s mewakili meta-analisis dari hasil
uji
oba terkontrol se
ara a
ak. Dalam dua periode terakhir, teknik meta-
analisis serupa telah diterapkan dalam studi observasional (epidemiologi
misal lingkungan) dan plot hutan sering digunakan dalam menyajikan
hasil penelitian tersebu juga.
• Saluran plot: ini adalah plot yang berguna untuk menge
ek keberadaan
bias publikasi di meta-analisis. Plot
orong, diperkenalkan oleh
ahaya
dan pillemner pada tahun 1994 dan dibahas se
ara rin
i oleh Egger dan
rekannya, yang emiliki tambahan berarti guna untuk meta-analisis. se-
buah plot
orong adalah sebar efek pengobatan terhadap ukuran ukuran
studi. hal ini digunakan terutama sebagai alat bantu visula untuk mende-
teksi Bias atau heterogenesis sistematis.
20
• Galbraith plot: dalam, statistik plot inijuga dikenal dengan Galbraith
petak radial atau hanya petak radial saja, adalah salah satu
ara menampilkan
beberapa perkiraan jumlah yang sama yang memiliki kesalahan standar
yang berbeda dengan hal ini dapat digunakan untuk memerikas hetero-
genitas. dala meta-analisis disebut sebagai alternatif atau suplemen untuk
plot hutan.
ontohnya ; untuk mengetahui dan mewakili kinetika enzim
• Plot Probabilitas : adalah teknik gra s yang digunakan untuk menilai
apakah suatu kumoulan data mengikuti distribusi tertentu seperti normal
atau weibull, dan untuk visual memperkirakkan lokasi dan skala param-
eter dari distribusi yang dipilih. Data diplot terhadap distribusi teoritis
sedemikian rupa bahwa poin harus membentuk sekitar garis lurus. Peny-
impangan dari garis lurus ini menunjukan keberangkatan dari distribuso
yang ditentukan.
21
• Nyquist Plot: Plot digunakan dalam kontrol dan pemrosesan sinyal otoma-
tis untuk menilai stabilitas sistem dengan umpan balik. Hal ini diwakili
oleh gra k dalam koordinat polar dimana keuntungan dan fase respon
frekuensi diplot. Plot ini jumlah fasor menunjukkan fase sebagai sudut
dan besarnya sebagai jarak dari titik asal.
• plot Spaghetti adalah metode melihat data untuk memvisualisasikan ke-
mungkinan arus melalui sistem. Arus digambarkan dengan
ara ini mun
ul
seperti mie, maka
oining istilah ini Metode statistik pertama kali digu-
nakan untuk mela
ak routing melalui pabrik. Visualisasi aliran dengan
ara ini dapat mengurangi ine siensi dalam aliran sistem.
22
• Plot Forest: adalah tampilan gra s yang menunjukkan kekuatan bukti
dalam studi ilmiah kuantitatif. Ini dikembangkan untuk digunakan dalam
penelitian medis sebagai sarana gra s mewakili meta-analisis dari hasil
uji
oba terkontrol se
ara a
ak. Dalam dua puluh tahun terakhir, teknik
meta-analisis serupa telah diterapkan dalam studi observasional (epidemi-
ologi misalnya lingkungan) dan plot hutan sering digunakan dalam menya-
jikan hasil penelitian tersebut juga
Plot
ontoh hutan lima odds ratio (kotak, sebanding dengan bobot yang
digunakan dalam meta-analisis), dengan ukuran ringkasan (garis tengah berlian)
dan interval keper
ayaan terkait (tips lateral diamond), dan garis vertikal yang
solid tidak berpengaruh. Nama ( ksi) studi ditunjukkan di sebelah kiri, rasio
odds dan interval keper
ayaan di sebelah kanan.
• Plot Star: Sebuah metode gra s menampilkan data multivariat. Setiap
bintang mewakili pengamatan tunggal. Biasanya, bintang plot yang di-
23
hasilkan dalam format multi-plot dengan banyak bintang pada setiap ha-
laman dan setiap bintang mewakili satu pengamatan.
• Permukaan Plot: Dalam jenis gra k, permukaan diplot untuk
o
ok satu
set kembar tiga data (X, Y, Z), di mana Z jika diperoleh dengan fungsi
yang akan diplot Z = f (X, Y). Biasanya, himpunan X dan Y nilai-nilai
yang sama spasi. Opsional, nilai-nilai diplot dapat warna-kode.
• Plot Ternary Sebuah plot terner, gra k terner, segitiga plot, alur simplex,
atau de Finetti diagram adalah plot bary
entri
pada tiga variabel yang
jumlah untuk konstan. Ini gra s menggambarkan rasio dari tiga variabel
sebagai posisi dalam sebuah segitiga sama sisi. Hal ini digunakan dalam
petrologi, mineralogi, metalurgi, dan ilmu-ilmu sik lainnya untuk menun-
jukkan komposisi sistem terdiri dari tiga spesies. Dalam genetika populasi,
sering disebut diagram de Finetti. Dalam teori permainan, sering disebut
plot simpleks.
24
• Stemplot: stemplot (atau batang-dan-daun plot), dalam statistik, adalah
perangkat untuk menyajikan data kuantitatif dalam format gra s, mirip
dengan histogram, untuk membantu memvisualisasikan bentuk distribusi.
Mereka berevolusi dari karya Arthur Bowley di awal 1900-an, dan alat
yang berguna dalam analisis data eksplorasi. Inferensi seperti histogram,
stemplots mempertahankan data asli untuk setidaknya dua signi kan digit,
dan memasukkan data dalam rangka, sehingga meringankan langkah un-
tuk memesan berbasis statistik andnon-parametrik.
25
• Shmoo Plot: Dalam teknik listrik, plot shmoo adalah tampilan gra s dari
respon dari komponen atau sistem yang berbeda-beda atas berbagai kon-
disi dan masukan. Sering digunakan untuk mewakili hasil pengujian sis-
tem elektronik yang kompleks seperti komputer, Asi
s atau mikroprosesor.
Plot biasanya menunjukkan berbagai kondisi di mana perangkat yang diuji
akan beroperasi.
• QQ plot: Dalam statistik, plot QQ (Q singkatan kuantil) adalah metode
gra s untuk mendiagnosis perbedaan antara distribusi probabilitas dari
populasi statistik dari mana sampel a
ak telah diambil dan distribusi per-
bandingan. Sebuah
ontoh dari jenis perbedaan yang dapat diuji adalah
non-normalitas distribusi populasi.
26
• Violin Plot: plot violin adalah metode meren
anakan data numerik. Mereka
mirip dengan kotak plot, ke
uali bahwa mereka juga menunjukkan kepa-
datan probabilitas dari data pada nilai yang berbeda (dalam kasus yang
paling sederhana ini bisa menjadi histogram). Biasanya plot violin akan
men
akup penanda untuk median dari data dan kotak yang menunjukkan
kisaran interkuartil, seperti dalam plot kotak standar. Overlay pada kotak
plot ini adalah estimasi densitas kernel. Plot biola yang tersedia sebagai
ekstensi untuk sejumlah paket perangkat lunak, termasuk R melalui per-
pustakaan vioplot, dan Stata melalui vioplot add-in.
Contoh Jenis gra k dan menggunakan mereka bervariasi sangat luas. Be-
berapa
ontoh khas adalah :
• Sederhana gra k: kurva Pasokan dan permintaan, gra k sederhana yang
digunakan dalam ekonomi untuk berhubungan pasokan dan permintaan
harga. Gra k dapat digunakan bersama-sama untuk menentukan keseim-
bangan ekonomi (pada dasarnya, untuk meme
ahkan persamaan).
• koordinat Non-persegi panjang: di atas semua menggunakan koordinat
persegi panjang dua dimensi;
ontoh gra k menggunakan koordinat polar,
kadang-kadang dalam tiga dimensi, adalah pola gra k radiasi antena, yang
mewakili kekuatan terpan
ar ke segala arah dengan antena tipe tertentu.
• graph sederhana yang digunakan untuk memba
a nilai-nilai: distribusi
probabilitas normal atau Gaussian berbentuk lon
eng, dari mana, misal-
nya, kemungkinan ketinggian manusia berada di kisaran tertentu dapat
diturunkan, mengingat data untuk penduduk laki-laki dewasa.
27
• Gra k Sangat kompleks: gra k psy
hrometri
, berkaitan suhu, tekanan,
kelembaban, dan jumlah lainnya.
28
PERANGKAT LUNAK YANG MENDUKUNG
VIOLIN PLOT
BAB III
February 2, 2016
VIOLIN PLOT
Semua variasi boxplot dibahas sejauh mempertahankan dasar KOTAK struk-
tur, bagaimanapun, dan ini adalah salah satu keterbatasan ini tampilan data.
kesederhanaan visual mereka dapat menyembungikan banyak rin
ian penting
tentang bagaimana nilai-nilai data yang didistribusikan. Sebuah jauh lebih
eksibel perpanjangan boxpolt dasar Violin PLot dibangun dengan mengu-
nakan konsep boxplot dengan perkiraan kepadatan nonparamerik. Kedua Box-
plots dengan estimasi kepadatan nonparamerik dibahas dengan menjelajahi-
data, tetapi gagasan menempatkan mereka bersama-sama dalam tampilan tidak
data tunggal. Violin Plot dibahas delam hal ini adalah salah satu
ara untuk
men
apai kombinasi ini , dan dibangun dalam komponen-komponen yang sama.
Violin Plot didukung dalam R baik sebagai bagian dari paket gratis kisi dan
melalui add-on paket wvioplot.
1
sebelumnya telah membahas Old Faithful geyser frame data yang setia, ter-
masuk dalam paket dataset instalasi dasar R, sebagian kaerena memberikan re-
spon bagus,
ontoh nyata data dataset dengan mendistribusikan nilai. bahkan
ini frame data men
akup dua variabel, waktu tunggu antar letusan beruntun
dibahas terkahir kali, dan durasi setiap letusan dan ternyata bahwa kedua vari-
abel tersebuat menunjukan distribusi bimodal kuat. hal ini mengambarkan den-
gan jelas dalam empat plot yang ditunjukan diatas ada dua plot yang pen
ar
dari nilai-nilai yang diamati dari variabel itu sendiri sementara bagian bawah
dua plot merupakan perkiraan kepadatan nonparamerik dihasilkan melalului
perintah R, mengunakan pilihan default.
seperti dalam pembahasan dari database ini karakter bimodal dari variabel-
variabel ini adalah jelas terlihat dalam plot besar pen
ar dari data nilai sendiri.
terutama dalam data durasi yang menunjukan kesenjangan antara sekitar 2.5
dan 3.0 dimana hanmpit tidak ada point sama sekali. alasan utama untuk
mepertimbangkan
ontoh ini adalah bahwa bimodality merupakan salah satu
rin
ian distribusi berpotensi signi kan yang umumnya hilang dalam boxplots.
hal ini jelas digambarkan dibawah ini menyajikan sisis-by-side boxplots waktu
menunggu dibagi menjadi 20 disebelah kiri, dan durasi letusan disebelah kanan.
kedua plot ini menunjukan gambar yang signi kan :
sebagian perbandingan, dua tokoh yang menunjukan dibawah ini dihasilkan
dengan menggunakan paket vioplot, yang menghasilkan plot yang mungkin
dipandang sebagai boxplot yang KOTAK telah melengkung untuk men
er-
minkan distribusi perkiraan nilai selama rentang data yang diamati. plot ini
sebelah kiri menggunakan opsi default untuk biplot dan salah satu poin dari
ontoh ini adalah bahwa pilihan default ini tidak terlalu jauh dari informatif
dari pada boxplot dasar.
hal ini tentunya, tak satu pun dari plot kiri sama sekali sugestif bimodalyty.
2
tangan kanan Violin Plot mewakili yang sedikit sisesuaikan. yang dihasilkan
dengan menentukan dua pilihan. pertama, perhatikan bahwa viloin Plot default
pada sebelah kiri keduanya terpotong, menunjukan batas antara keras terke
il
dan terbesar nilai yang mun
ul dalam data. kliping adalah denfault, tetapi
menunjukan klip = F menimpa prilaku ini yang tidak khas untuk estimasi
kepadatan ninparametrik, bukanya tiba-tiba jatuh ke nol.
kedua, yang lebih penting perbedaan antar dua set violin plot ditampilkan
diatas sepasang angka yang pasangan kanan menentukan parameter bandwidth
yang berbeda untuk ini estimator densitas nonparamertrik. trade-o yang melekat
dalam memilih parameter dandwidth untuk estimitar densitas nonparametrik
: membuat bandwidth terllau ke
il menghasilkan varians tinggi berisik esti-
masi biasanya banyak yang :Palsu . salha satu point tertinggi dalam hal ini
adalah dalam kemampuan tambahan yang melekat pada violin plot ren
ana
relatif dalam boxplot sederhana dapat menyampaikan denfault rin
ian sangat
berguna untuk kita mungkin melewatinya, kita tidak dapat selalu mengenda-
likanpengaturan denfault untuk prosedur menunukan rin
ian ini. sumber dasar
kesulitan ini adlaah prosedur yang lebih komplo=eks seperti estimator densitas
non pramaertik.
0.1 R Software
Bahasa R merupakan versi terbuka (open-sour
e) dari bahasa pemrograman S
(Azola dan Harrel 2006). Bahasa R memiliki kemampuan yang tidak kalah den-
gan paket-paket program pengolahan data komersial bahkan dalam beberapa
hal kemampuannya lebih baik. Bahasa R mendapatkan sambutan baik dikalan-
gan statistikawan dan ilmuwan di seluruh dunia, sayangnya di indonesia sendiri
belum banyak yg mengenalnya. Buku ini memberikan pengetahuan tentang ba-
3
hasa R yg merupakan sebuah software stati
open sour
e yang berguna untuk
proses analisi data, khususnya dalam memanipulasi data dan visualisasi gra k.
Kemampuan tersebut yang dipilih karena merupakan hal yang paling penting
dalam operasi data/ statisti
.
1.1 Cara Kerja Bahasa R
Kentungan -keuntungan yang diperoleh bila menggunakan bahasa R untuk
pengolahan data dan statistik antara lain: R dapat diakses gratis dan dapat
dijalankan pada berbagai sistem operasi (WINDOWS, UNIX, MACINTOSH) ,
sintaksnya mudah dipelajari dan memiliki banyak fungsi -fungsi statistik yang
terpasang. Selain itu, beberapa kerugian yang di kemukakan juga oleh Verzani
(2002) yaitu tidak mendapatkan dukungan komersial. Azola dan Herrel (2006)
memberikan perbandingan rin
i atas kemampuan bahasa R terhadap sebuah
program komersial seperti SAS. S-Plus yang merupakan kloning dari bahasa
R memiliki antar muka yang lebih baik, tetapi pada prosesnya berjalan sedikit
lebih lambat dari bahasa R. bahasa R merupakan sebuah paket dan seklaigus
bahasa pemrograman tingkat tinggi (high level programming). R dapat digu-
nakan se
ara interaktif sehingga hasilsebuah perhitungannya segera dapat dili-
hat, etatpi apabila perhitungannya kompleks maka perintah - perintah R ditulis
lebih dahulu sebagai text editor , kemudian dipanggil dengan fungsi sour
e. R
yang termasuk program software opensour
e diran
ang sebagai voluntary oleh
ahli-ahli statistik dan pemrograman di seluruh dunia, sehingga perkembangan-
nya amatlah sangat
epat. Veri bahasa R ketika tulisan ini dibuat adalah 3.0.2
R dan dilengkapi dengan pa
kage (add-in) yang dapat memberikan kemampuan
tambahan, seperti
ontoh perhitungan teknik-teknik statistik yang
anggih, in-
terfa
e dan lain lain. Pa
kages ini juga dapat diakses se
ara gratis. dan se
ara
periodik akan mun
ul pa
kage - pa
kage terbaru yang lebih menarik dan da-
pat dipilih sesuai kebutuhan. semua pa
kage berikut dapat di peroleh se
ara
gratis di URL (http://
ran.r-proje
t.org/). Pada URL tersebut dapat dipilih
tiga alternatif instalasi software R, yaitu : instalasi menurut linux, windows,
dan Ma
OS X. Terdapat banyak GUI lain yang dapat diperoleh se
ara gratis
antara lain Remdr dan S
iViews. Remdr dikemas didalam pa
kage R. jika telah
memilih akan menggunakan alternatif salah satunya, maka akan keluar versi
terbaru software R yg telah siap didownload.
R dapat diakses se
ara gratis di URL (http://www.r-proje
t.org/). dalam
hal pemakaian, R termasuk software yg
ukup mudah untuk dipelajari,bahkan
melalui ashdisk USB saja software R sudah bisa digunakan. Berikut adalah
langkah-langkahnya.
0.1.1 Instalasi R windows di Hardisk :
1. Setelah mendownload le instalasi (sebagai
ontoh, le yang digunakan
dalam buku ini adalah R-3.0.2 -win.exe), maka terdapat le instalasi R
4
2. Double
li
k i
on le tersebut, hingga mun
ul pilihan bahasa seperti pada
Gambar 2. Pilih bahasa English lalu klik OK.
5
3. Selanjutnya akan mun
ul jendela setup seperti pada Gambar 3 dan pilih
Next. Lanjutkan pilihan ke Next lagi setelah mun
ul jendela berikutnya. Lalu-
akan mun
ul jendela dialog untuk memilih lokasi startup R seperti Gambar
4.
4. Selanjutnya akan mun
ul jendela yg terkait dengan informasi instalasi
software R seperti pada gambar lalu klik next
6
5. Pada kondisi default, pilih lokasi aplikasi R akan diletakkan di : C:\Program
Files\R\R-3.0.2. Jika setuju meletakkan aplikasi R ditempat tersebut pilih
Next. Selanjutnya akan mun
ul
ustom installation seperti Gambar 5. Setting
intalasi ini adalah default setting, sehingga tidak perlu melakukan perubahan
pada setting ini. Selanjutnya pilih Next. Selanjutnya pilih Next lagi jika tidak
ingin melakukan perubahan pada lokasi startup R. Atau klik Yes sebelum Next
jika nantinya ingin merubah lokasi startup R.
6. Bila proses instlasi berjalan dengan benar, maka aplikasi R dapat diakses
7
dengan meng klik i
on dari software R (pada desktop ataupun start menu).
Selanjutnya akan terbuka jendela pembuka program R seperti itu.
Berikutnya untuk mendownload library/pa
kage yang khusus untuk analisis
statistik dengan menggunakan R
ommander. Cara installnya dapat langsung
dari software R, dan instalasi yang diminta oleh software R adalah se
ara online.
Sebagai berikut :
1. Pilih pa
kages, lalu pilih install pa
kages. Selanjutnya akan mun
ul tampi-
lan pilihan wilayah / lokasi download.
2. Lalu akan mun
ul jendela tampilan pilihan pa
kages yang akan di install
Setelah itu pilih r
mdr dan plugin yang ingin di instalasi, lalu klik OK.
3. Setelah instalasi selesai, buka R
ommander. Caranya dengan memilih
menu pa
kages lalu pilih load pa
kages kemudian pilih r
mdr dan klik
OK.
4. lalu klik nish jika telah selesai mendownload.
0.1.2 instalalsi le R windows pada usb
bagi yang membutuhkan R agar dapat digunakan dimanapun berada, melakukan
instalasi di ashdisk dan USb akan sangat bermanfaat. berikut adalah
ontoh
petunjuk instalasi R di asdisk USB.
1.
opy le instalasi kedalam ashdisk UB. lalu double klik le instalasi
dalam ashdisk USB tersebut seperti langkah instalasi pada hard disk
(langkah 1 sampai dengan langkah 5).
2. pada langkah (sele
t destination lo
ation) klik browse dan arahkan lokasi
instalasi R / startup ke USB drive. Sebagai
ontoh lokasi instalasi pada
G:/R-2.8.1 jika lokasi ashdisk USb berada pada driver G. selanjutnya
klik next.
8
3. selanjutnya akan mun
ul jendela dialog sele
t
omponent klik semua
PDF manual online jika setidaknya kapasitas ashdisk USB berisi 1 gb.lalu
klik next.
4. selanjutnya,akan mun
ul jendela dialog startup options . Klik yes untuk
mempermudah lokasi startup R. lali klik next.
5. pada jendela selajutnya klik help style atau CHM style. pilih sele
t
start menu folder dan dont
reate a start menu folder , lalu klik next.
6. setelah mun
ul jendela dialog berisi sele
t additional taks tidak perlu
men
ontreng semua task. lalu klik next, dan proses instalasi akan dimulai.
tunggu sampai proses instalasi selesai dilakukan sampai selesai.
7. selanjutnya untuk membuat direktori pekerjaan drive USb untuk user.
buka My Computer dan arahkan pada drive USb untuk user. pilih le
-> new -> folder (atau dalam win Vista pilih organize -> new folder).
Beri nama folder tersebut, misalnya RFiles .
8. selanjutnya, buat short
ut R-Gui pada ashdisk USB lalu buka My
omputer dan arahkan pada lokasi di lokasi USb drive dimana short
ut
ingin diletakan. lalu di bagian kosong pada layar windows, klik kanan
dan pilih new -> short
ut. di pilihan Create Short
ut
ari dan pilih Gui
program yg terletak di subdirektori biin. sebagai
ontoh, jika menginstal
R di G:R-2.11.0 maka le di G:\R-2.11.0\bin\Rgui.exe lalu klik next dan
berikan nama pada short
ut tersebut lalu klik nish.
9. selanjutnya, pada short
ut baru tersebut klik kanan dan pilih properties
hingga keluar jendela dialog seperti pada gambar.
9
10. pada tab short
ut di pilih start in dan tuliskan alamat dimana direktori
pekerjaan berada seperti pada
ontoh.
uji proses instalasi dengan double klik pada le short
ut. jika telah terbuka
pada jendela pembuka program R seperti pada gambar 3.12 maka instalasi R
melalui USb telah sukses dilakukan. selanjutnya melalu R dapat dioperasikan
di
omputer manapun tanpa terlebih dahulu melakukan instalasi di hard disk
komputer.
berdasarkan pengalaman, untuk kelan
aran dan ke
epatan operasioanl. jika
ingin melakukan instalasi R pada ash disk sebaiknya disediakan Flashdisk den-
gan kapasitas besar dan harus tersisa min 1 GB.
0.1.3 Input data dalam R.
ada beberapa
ara untuk memasukan data yang diolah melalui R, yaitu :
• input data melalui jendela
onsole R
• input data melalui jendela
onsole R Comander
• impor data yang telah diinput dalam le database yang lain ( txt, dbf,
xls, mtp) melalui R
ommander
0.1.4 Skema kerja bahasa R
Setelah R terinstal pada komputer maka dapat diakses melalui short
ut atau
menu start. Prompt default > mengindikasikan bahwa R menunggu perin-
10
tah yang diberikan, baik berupa fungsi maupun objek lain. R merupakan su-
atu bahasa berorientasi objek, artinya bahwa variabel, data, fungsi, hasil dan
sebagainya, disimpan dalam memori aktif komputer dalam bentuk objek dan
mempunyai sebuah nama. Pengguna dapat mengenakan aksi terhadap objek-
objek tersebut melalui suatu operator (aritmatika, logika, dan perbandingan)
dan fungsi (fun
tions). Fungsi itu sendiri juga merupakan suatu objek. Pena-
maan terhadap objek bersifat
ase sensitive(membedakan huruf besar dan huruf
ke
il). Jadi X dan x merupakan objek yang berbeda.
Argumen suatu fungsi dalam R juga merupakan suatu objek ( data , for-
mula, expresi, dan sebagainya). Beberapa fungsi menyediakan nilai default dari
argumennya, nilai ini dapat diubah oleh penggunanya dengan options tertentu.
Beberapa fungsi tidak membutuhkan nilai argumen dalam menjalankan perin-
tahnya, hal ini dapat terjadi karena ada dua kemungkinan 1) semua argumennya
mempunyai nilai default (karenanya dapat diubah dengan options). Jadi dalam
mengeksekusi fungsi tersebut tidak perlu memasukkan nilai argumen, karena
fungsi akan menggunakan nilai default sebagai nilai argumen. 2) tidak ada
argumen yang dide nisikan sebelumnya pada fungsi tersebut.
Objek-objek R (termasuk fungsi) dikemas dalam bentuk add-ins yang oleh
R disebut denganpa
kage. Pada saat R dipanggil pertama kali, maka ada tujuh
pa
kage yang dipanggil dan disimpan dalam memori aktif. Perintah R untuk
melihat pa
kage apa saja yang sedang aktif adalah :
>sear
h()
[1℄ .GlobalEnv pa
kage: stats pa
kage:graphi
s
[4℄ pa
kage:grDevi
es Pa
kage:utils pa
kage:datasets
[7℄ pa
kage:methods Autoloads pa
kage:base
Fungsi sear
h() adalah
ontoh fungsi R tanpa argumen. Hasil eksekusi dari
fungsisear
h() ini disajikan di bawahnya. Jadi setiap nama objek yang diketik
pada
onsole (GUI) R akan ditelusuri ke ".GlobalEnv", "pa
kage:stats", "pa
k-
age:graphi
s", ..., "pa
kage:base". Pesan error akan mun
ul apabila nama objek
yang diketik pada
onsole tidak dikenal.
Untuk memperoleh bantuan digunakan fungsi help, sedangkan untuk meli-
hat argumen-argumen apa saja yang dibutuhkan oleh fungsi help, digunakan
perintah (fungsi) args.
11
Terlihat disini bahwa, fungsi help mempunyai 9 argumen yaitu topi
, of-
ine, pa
kage, . . . , pager. Argumen o ine, pa
kage dan lib.lo
berturut-turut
mempunyai nilai default FALSE, NULL dan NULL. Argumen verbose mem-
punyai nilai default berupa fungsigetOption yang diberi nilai verbose . Oleh
karena args merupakan suatu fungsi, maka untuk melihat argumen apa saja
yang tersedia bagi args adalah
>args(args)
funstion (name)
Terlihat bahwa fungsi args hanya membutuhkan satu arugmen, yaitu name
tanpa nilai default. Perintah args(help) memberikan hasil yang sama den-
gan args(name=help). Jadi nilai argumen suatu fungsi dapat ditulis langsung
tanpa didahului oleh nama argumennya, tetapi apabila ada lebih dari satu ar-
gumen pada suatu fungsi, maka urutan penulisan nilainya perlu diperhatikan.
Penulisan nilai argumen dengan nama argumen didepannya, dapat dilakukan
tanpa memperhatikan urutannya.
fungsi-fungsi terpasang bulit in apa saja yang telah disediakan oleh pa
kage
base, dan dapat dilihat dengan menggunakan fungsi help sebagai berikut.
>help(pa
kage='base')
Hasilnya, sebuah windows yang mendaftarakan semua objek dan fungsinya
terpasang yg disediakan oleh pa
kage base.
Semua aksi pada R dilakukan dengan memanipulasi objek yang tersimpan
pada memori aktif komputer: tanpa menggunakan le temporary. Pengguna
mengeksekusi fungsi, yang mana nilai argumen akan menentukan hasilnya (da-
12
pat juga berupa suatu gra k). Hasil eksekusi ini diperagakan se
ara langsung
pada layar, disimpan pada sebuah objek yang dapat diberi nama tertentu, atau
ditulis pada disk (khusunya gra k). Oleh karena hasil itu sendiri merupakan
sebuah objek, maka objek ini dapat merupakan nilai argumen (data) bagi fungsi
lain untuk selanjutnya dieksekusi.
0.1.5 R Bekerja dengan Data
R bekerja berdasarkan jenis struktur datanya. Struktur data paling sederhana
adalah ve
tor. Vektor dibuat dengan fungsi
, hasilnya disimpan dalam suatu
objek. Berikut ini adalah teladan tipe vektor numerik.
>x < -
(10, 4.5, 6, 7, 2.3, 7.1 )
objek x menyimpan nilai numerik 10, 4.5, 6, 7, 2.3, dan 7.1. perintah untuk
menampilkan isi dari objek x adalah .
>x
[1℄ 10.0 4.5 6.0 7.0 2.3 7.1
perintah untuk memperoleh nilai objek x pada urutan yang ketiga adalah
>x[3℄ #digunakan kurung siku untuk menga
u pada subs
ript.
[1℄ 6
perintah berikut memberikan vektor logika (TRUE and FALSE) untuk nilai-
nilai objek yang lebih besar dari 6.
>x.lebih.dari.6 <- x>6
>x.lebih.dari.6
[1℄ TRUE FALSE FALSE TRUE FALSE TRUE
objek x.lebih.dari.6 merupakan objek bertipe logi
al. Nilai-Nilia objek x yang
lebih besar dari 6 diakses dengan perintah sebagai berikut.
> x[x.lebih.dari.6℄
[1℄ 10.0 7.0 7.1
objek x dapat dikonversikan menjadi bertipe integer yaitu dengan perintah
sebagai berikut :
>y <- as.
hara
ter(x) #objek x dikonversikan ke tipe karakter
>y
[1℄ 10 4.5 6 7 2.3 7.1
Rata-rata, median, ragam, dan simpangan baku dari data yang tersimpan
pada peubah objek (x), diperoleh dengan menggunakan fungsi-fungsi berikut :
• >mean(x)
[1℄ 6.15
• >var(x)
[1℄ 6.803
• sd(x)
13
[1℄ 2.608256
Ringkasan statistik untuk data yang disimpan pada objek x, dieksekusi den-
gan fungsi summary berikut.
> ringkas <- summary(x)
> #hasil fungsi summary disimpan pada objek ringkas
>ringkas
Min. 1st Qu. Median Mean 3rd Qu. Max.
2.3004.875 6.500 6.150 7.075 10.000
• Interaksi R dengan format data berbeda
Fungsi read.table digunakan untuk memba
a data dalam format as
ii(txt, dat).
Fungsi ini tersedia pada pa
kage base. perintah ntuk memanggil le CANCR.txt
adalah sebagai berikut.
>kanker<-read.table( le='CANCER.txt', header= TRUE)
>kanker
File CANCER.txt disumsikan tersedia pada direktory default. Perubahan
working direktory dapat dilakukan melalui menu Change dir. . . atau dengan
perintah setwd. fungsi le.
hoose() dapat digunakan sebagai nilai dari argumen
le, untuk memilih le yang dikehendaki, sehingga ditulis sebagai berikut:
>kanker<-read.table( le.
hoose(), header=TRUE)
Fungsi R untuk menyimpan suatu objek dalam format as
ii adalah write.table,
yaitu sebagai berikut :
>write.table(kanker, le= Kanker.txt )
Perintah ini akan menyimoan objek kanker ke dalam le Kanker.txt pada
direktori default yang terdapat di harddisk atau USB.
R dapat memba
a le data dengan format xls (spreadsheet ex
el), dengan
perintah read.xls. Fungsi ini tersedia pada pa
kage xlsReadWrite, yang dapat
di download gratis pada http://
ran.r-proje
t.org.. Jadi untuk dapat meng-
gunakan fungsi read.xls, pa
kagexlsReadWrite harus terlebih dahulu diinstal,
kemudian diaktifkan dengan perintah sebagai berikut:
>library(xlsReadWrite)
Apabila le A
idents.xls ( le A
idents.xls harus ada dalam direktori de-
fault, bila tidak ubah dengan menu File|Change dir . . . ) ingin dipanggil dan
disimpan pada objek k
lk, maka perintah-nya adalah
> k
lk <-read.xls( le='A
idents.xls')
>k
lk
[1℄ data frame
Terlihat bahwa objek k
lk (berklas data frame ) memliki dua variabel Week
dan Number of A
idents dengan 52 pengamatan. Nilai-nilai dari variabel Num-
ber of A
idents dapat diakses dengan
ara sebagai berikut:
14
Angka 2 dalam tanda kurung siku menunjukkan bahwa variabel Number of
A
idents ada pada urutan ke 2. Oleh karena nama variabel Number of A
i-
dents tidak sesuai dengan tata
ara penamaan dalam R (spasi tidak diperke-
nankan), maka nama variabel data frame k
lk diganti dengan perintah :
Sehingga sekarang variabel Week dan Number.of.A
idents dapat dipanggil
langsung sebagai suatu objek R dengan terlebih dahulu mengenakannya dengan
fungsi atta
h (angka-angka [1℄, [15℄, [29℄, dan [43℄ menunjukkan nomor-nomor
urut data yang ada disebelah kanannya)
15
Demikian pula nilai-nilai variabel week dipanggil dengan
ara sebagai berikut
;
16
Format data lain seperti mtp (minitab), spss (SPSS), dbf (DBF le), systat,
SAS dapat diba
a oleh R. Perintah untuk memba
a format data tersebut ada
pada pa
kage foreign .
• Pembangkitan Data
Sekuens bilangan bulat misalnya dari 1 sampa 30 dibangkitkan dengan
ara
sebagai berikut :
>x<- -1:30
Hasilnya adalah sebuah vektor x yang berisi 30 elemen, berupa sekuens bi-
langan bulat dari 1 sampai 30. fugsi sequen
e berikut ini dapat membangkitkan
sequens bilangan rill sebagai berikut:
> seq(1, 5, 0.5)
[1℄ 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0
Bilangan pertama pada argumen fungsi seq menunjukkan nilai awal dari
sekuens, sedangkan bilangan keduanya merupakan nilai akhir sekuens, dan bi-
langan terakhir menunjukkan angka penambahannya (in
rement). Bentuk lengkap
dan argumen fungsi seq adalah sebagai berikut:
17
Argumen times memberikan berapa kali suatu bilangan diulang. Perintah
berikut mengulang sekuens 1 sampai 4 sebayak 2 kali (sebagaimana halnya den-
gan fungsi-fungsi lain vektor sekuens dapat disimpan dalam suatu objek sebagai
berikut: x <- rep(2, 20), nama argumen tidak perlu ditulis dan argumen kedua
adalah times)
> rep(1:4, 2)
[1℄ 1 2 3 4 1 2 3 4
Argumen ea
h dibawah ini menbulanb setiap elemen dalam sequen
e se-
banyak dua kali:
>rep(1:4, ea
h =2)
0.2 VIOLIN PLOT GGPLOT2
ggplot2 violin plot adalah memudahkan untuk menggunakan fungsi - fungsi
untuk meren
anakan dan menyesuikan dengan mudah violin plot mengunakan
ggplot2 dan sotfware R. fungsi ggplot2.violinplot adalah lebih mudah dari paket
ggplot2 R. Violin Plot mirip dengan kotak Plot . ke
uali bahwa mereka juga
menunjukan kepadatan probabilitas kernel dari data yang menunjukan kiasaran
interkuartil, seperti dalam plot kotak standar(wiki).
ggplot2.violin adalah fungsi untuk memudahkan kostum untuk meren
anakan
dan menyesuaikan dengan mudah plot plot violin mengunakan ggplot2 dan soft-
ware R. fungsi dari ggplot2.violin itu sendiri adalah memudahkan paket ggplot
R. s
ript R tersedia dalam bagian berikutnya untuk menginstal paket.
violin plot mirip dengan kotak plot, ke
uali bahwa mereka juga menun-
jukan kepadatan probabilitas kernel dari data nilai pada nilai yang berbeda-
beda.Biasanya Plot biola akan men
akup penanda untuk median dari data kotak
menunjukan kisaran interkuartil, seperti dalam plot kotak standar(wiki).
18
19
• Basi
Violin Plot
#violin plot dari vektor numerik tunggal
ggplot2.violinplot(data=numVektor)
#Violin dasar Plot dari vektor LEN
ggplot2.violinplot(data=df,XName = 'dosisi',yName= LEN )
#Mengubah Orientasi :Horizontal Violin petak
ggplot2.violinplot(data=df,XName = 'dosisi',Yname = LEN , orientasi =
'horizontal')
#Set Trim untuk PALSU. Jika TRUE Maka (Denfault), memangkas ekor
#Violin dengan bebrbagai data.
#Jika SALAH, tidak memangkas ekor.
ggplot2.violinplot(data = df, XNAMe ='dosis', YName = 'len', trim =
FALSE).
20
21
• Violin Plot dengan Rata-rata dan titik.
setiap titik mewakili satu observasi dan titik berarti sesuai dengan nilai rata-rata
dari pengamatan dikelompok itu sendiri.
#Violin Plot denagn rata-rata titik.
ggplot2.violinplot(data = df, XName = 'dosis', YName = 'Len', addMean
= True,
meanPointShaoe = 23, Meanpointsize = 3, meanpointWarna = 'Hitam',
dotsize= 1, dotPosition
='
enter').
#Violin Plot dengan titik bergoyang
#jitter:derajat di arah x
ggplot2.violinplot(data = df, XName = 'dosis', YName = 'len', addDot =
TRUE, dotSize =1,7,
dotPostion= Jitter , Jitter = 0,2).
22
23
• Mengubah Biola petak jenis garis dan titik bentuk
1. Bentuk titik yang berbeda dan jenis garis dapat digunakan dalam plot. Se-
ara Denfault, ggplot2 mengunakan jenis garis padat dan bentuk lingkaran.
Bentuk tiitk yang bebreda di R dijelaskan disini.
#Mengubah warna Violin Plot alur
erita dan jenis garis
ggplot2.violin plot (data = df, XName = 'Tidak', YName = 'Len', warna
= merah', line type = Bertitik ).
24
• Main title dan judul plot.
1. Main Title Font : Vektor dengan panjang 3 menunjukan masing-masing
ukuran, gaya ( Miring , berani , bold.ita
li
) dan warna sumbu x dan y
judul. Nilai denfault adalah : mainTitleFont =
(14, bearni , hitam ).
2. xShowTitle : yShowTitle jika TRUE, sumbu x dan y judul akan dita-
mpilkan. Set nilai ke FALSE untuk menyembunyikan label sumbu.Nilai
default adalah BENAR.
3. xtitle , ytitle : x lebel dan sumbu y. Nilai default adalah NULL.
4. Xs
ale, y S
ale sumbu x dan y sisik. Kemungkinan nilai
( tidak ada ,
log 2 , log 10 ). mis: yS
ale - log2 . Nilai default adalah BENAR.
5. xtitleFront, yTitleFront : vektor panjang 3 menunjukan masing-masing
ukuran , gaya dan warna x dan y judul sumbu. nilai yang mungkin un-
25
tuk gaya : polos , miring , berani , bld.itali
. warna dapat ditetapkan
sebagai kode hexsadesimal.
6. xlim batas y lim : untuk sumbu x dan y. Nilai default adalah NULL.
7. xShowTi
klabelFront, yShowTi
kLabelFont : vektor panjang 3 yang me-
nunujukan masing- masing ukuran, gaya dan warna sumbu y dan x pada
label ti
k front.
8. xTi
kLabelRotation, yTi
kLabelRotation : rotasi sumbu x dan y label
sumbu ti
k. nilai default nya adalah 0.
9. hideAxisTi
k : jika TRUE , y dan x kutu sumbu tersembunyi. Nilai
defaultnya adalah SALAH.
10. AxisLine : vektor dengan panjang 3 menunjukan masing- masing ukuran ,
jenis garis dan warna garis sumbu. nilai defaultnya adalah
(0,5 , solid',
# e5e5e5 ).
3. Viloin Plot dalam Python :
• lter data dengan jendela kaiser-Bessl di python :
• Regresi linier dan berjalan dalan Python :
26
• Mengelompokan dengan Python :
4. VIOLIN PLOT DENGAN MATLAB :
• Diagram Taylor diMATLAB :
27
• EOF dekomposisi dalam MATLAB :
• Matrix Kinerja di MATLAB DAN PYTHON :
1. MATLAB :
28
2. PYTHON :
5. Violin Plot dengan Matplotlib
Salah satu hal yang sangat penting dari mattplotib untuk waktu yang sangat
lama adalah implementasi ren
ana Violin. Banyak waktu, tidak pernah men-
emukan waktu. disini saya menemukan tulisan sese orang tentang Violin Plot
dengan Matplotip. Baru saja menambahkan Fill_between fungsi.
29
Violin Plot sangat mirip dengan Box dan whiskers Plot, Namun mereka
menawarkan pandangan yang lebih rin
i dari variabilitas daraset ini. ini ser-
ing dengan ide yang baik untuk menggabungkan mereka pada plot yang sama
.seperti dibawah ini.
30
Langkah selanjutnya sekarang adalah untuk membersihkan kontribusi plot
ini untuk Matplotib, tapi sebelumnya tidak tahu apakah ini akan diterima untuk
matloplot menambah S
ipy sebagai depensi. Tapi karena kembali melaksanakan
- estimasi densitas kernel untuk plot yang sederhana akan berlebihan.
31
BAB 4
CONTOH KASUS VIOLIN PLOTS DENGAN
SOFTWARE R
February 2, 2016
ontoh kasus penggunaan atau pemanfaatan violin plots atau plot biola.
sebuah plot biola adalah metode meren
anakan data numerik. ini adalah
plot kotak dengan seputar kepadatan kernel plot pada setiap sisi.
biola plot mirip dengan kotak plot, ke
uali bahwa mereka juga menun-
jukkan kepadatan probabilitas diri data pada nilai yang berbeda (dalam kasus
yang sederhana bisa menjadi histogram). biasanya plot biola akan menn
akup
penanda untuk median dari data kotak yang menunjukan kisaran interkuatil,
seperti dalam plot kotak standar. overlay pada kotak ploy ini adalah estimasi
densitas kernel.
plot biola yang tersrdia sebagi ekstensi untuk sejumlah paket perangkat lu-
nak, termasuk R dan ggplot2. plot biola juga
ukup mirip dengan gra k yang
digunajkan dalam STATA.
R tutorial ini menjelaskan
ara membuat plot biola menggunakan R perangkat
lunak dan paket ggplot2.
plot biola mirip dengan kotak plot, ke
uali bahwa mereka juga menunjukan
kepadatan probabilitas kernel dari data pada nilai yang berbeda. biasanya plot
biola akan men
akup penanda untuk median dari data dan kotak yang menjun-
jukan kisaran interkuartil, seperti dalam plot kotak standar.
1
fungsi geom_violin() digunakan
untuk menghasilkan plot biola.
2
DASAR DARI PLOT BIOLA
perpustakaan (ggplot2)
# biola petak dasar
p<-ggplot(ToothGrowth, aes (x= dose, y=len))+geom_violin()
p
# putar plot biola
p+
oord_ ip()
#set trim argumen ke FALSE
ggplot(ToothGrowth, aes(x=dose, y=len)+geom_violin(trim=FALSE)
3
ARGUMEN
x
#data vektor
vektor data tambahan
jarak
faktor untuk menghitung atau nilai yang berdekatan rendah atas
h
ketinggisn untuk rstimator densitas, jika menghilangkan seperti
yang dijelaskna dalam sm. density, h akan ditetapkan ke sebuah optial
ylim
batas y
nama
satu labek, atau vektor label untuk data harus sesuai dengan jum-
lah data yang diberikan
ol, perbatasan, lty, LWD
4
parameter gra s untuk biola di teruskan ke garis pligon
re
t Col,
olMed, phMed
parameter gra s untuk mengontrol tampilan kotak
Siapa saja yang menggunakan pekt ggplot2 di R adalah mungkin
akrab dengan geom_violin, yang men
iptakan plot biola. yang terli-
hat seperti berikut :
Library (ggplot2)
ggplot(mt
ars, aes(x = fa
tor(
yl), y=mpg, ll = fa
tor(
yl))) +
geom_violin()
5
perangkat lunak ini sekilas menunjukan pemirsa bentuk distribusi
dan memungkinkan mereka dengan mudah memperkirakan modus
dan jangkauan. Jika anda juga membutuhkan median dan rentang
interkuartil, itu sederhana untuk menampilkan dengan overlay kotak
plot(plot biola biasanya di buat dengan
ara ini) :
ggplot(mt
ars, aes(x= fa
toe(
yl), y = mpg))+
geom_violin(aes ( ll = fa
tor (
yl))) +
geom_boxplot (width = 0.2)
6
PLOT BIOLA DENGAN GRAFIK
BAR
Lebih umum untuk melihat gra k batang dibandingkan dengan plot
biola. yang informasinya akan sama dengan plt biola seperti berikut
aranya:
Library (dplyr)
mt
arssummary <- my
ars %>%
group_by(
yl) %>%
summarize (mpg_mean = mean(mpg),
mpg_se = sqrt (var (var(mpg) / length (mpg)))
ggplot (mt
arsSummary, aes (x = fa
tor (
yl, y= mpg_mean, ll
= fa
tor (
yl))) +
7
geom_bar(stat= identity )
Gra k batang menyoroti statistik tunggal memilih analisis. Dalam
psikologi ( dan bidang lainnya), peneliti menggunakan gra k batang
untuk memvisualisasikan mean dari data, dan biasanya men
akup
bar kesalahan untuk menunjukan kesalahan standar ( atau interval
keper
ayaan lain).
Namun, ketika kita melihat grafk batang,
ara mereka keliru me-
nilai nilai-nilai yang jatuh di dalam bar (yaitu dibawah rata-rata)
sebagai lebih mungkin dibandingkan nilai berjarak sama dari mean
tetapi di luar bar.
Bios ini tidak mempengaruhi plot biola karena wilayah di dalam
biola berisi seua data yang diamati. Mean dan standard error adalah
8
statistik hanya berguna bila ita menganggap bahwa data biasanya
didistribusikan.
Gra k batang tidak membantu kita memeriksa asumsi seperti itu.
Untuk studi ukuran sampel yang terke
il, itu lebih efektif untuk
hanyameren
anakan setiap pengamatan tunggal.Sampai Bergmann
dieksplorasi pendekatan ini dalam posting yang men
akup kode R.
Jika itu penting untuk menampilkan mean dan standard error,
nilai-nilai ini dapat dilakukan overlay pada visualisasi apapun.
Library(gridExtra)
plotBaras <- ggplot (mt
arsSummary, aes(x = fa
tor(
yl), y =
mpg_mean,
geom_bar (aes ( ll = fa
tor(
yl)), stat = identity ) +
geom_errorbar(aes(y = mpg_mean, ymin = mpg__mean-mpg_se,
ymax = mpg_
olorn= bla
k , width = 0.4) + ylon( 0,35) + theme(legend.position
= none ) + ggtitle ( Bar Grapfh)
plotPoints <- ggplot (mt
ars, aes9 x= fa
tor(
yl), y= mpg,
olor
= fa
tor(
yl)))+
geom_point( aes( y= mpg,
olor = fa
tor(
yl)),
position = position_jitter(width = 0.25, height = 0.0, alpha =0.6)
+
geom+point(aes(y= mpg_mean),
olor = bla
k , size =2, data =
mt
arsSummary) +
geom_errorbar(aes(y = mpg_mean, ymin = mpg+mean-mpg_se,
ymax = mpg_mean + mpg_se),
olor = bla
k , width = 0.2, data = mt
arSummary)+ ylim(0.35)
+theme(legend.posisition = none )+(ggtitle ( every observation)
plotViolins <- ggplot (mt
ars, aes( x= fa
tor(
yl), y= mpg, ll=
fa
tor(
yl)))+
geom_violin(aes(y = mpg, ll = fa
tor(
yl))) +
9
geom_point(aes (y = mpg_mean),
olor - bla
k , size =2, data
=mt
arsSummary) +
geom_errorbar( aes ( y = mpg_mean, ymin = mpg_mean-mpg_se,
ymax = mpg_mean+mpg_se),
olor = bla
k , width = 0.2, data = mt
arSummary) + ylim(0,35)
+ theme(legend.posisition = none) + ggtitle ( Violin plot )
grid.arrange (plotBars, plotPoints, plotViolins, n
ol =3)
10
PLOT BIOLA DNGAN PLOT
KEPADATAN
Sebuah plot biola menunjukan kepadatan distribusi menggunakan
lebar plot, yang simetris pada porosnya, sementara plot kepadatan
tradisional menggunakan ketinggian dari dasar umum. Mungkin lebih
mudah untuk memperkirakan perbedaan relatif dalam plot kepaatan,
meskipun kita tidak tahu apakah ada penelitiannya.
Lebih penting lagi, plot kepadatan (atau histogram)siap menampilkan
perkiraan kepadatan, sedangkan plot biola biasanya tidak hadir dalam
keadaan tersebut.
ggplot(mt
ars, aes (x= mpg, ll = fa
tor(
yl))) +
11
geom_density (alpha = 0.6)
MENGGUNAKAN PLOT BIOLA
Mengapa jika kita ke gra s basis R sepertinya paket plot biola dapat
membuat plot biola tanpa menggunakan ggplot2?
Seaborn mun
ul untuk membawa plot biola yang sangat kuat un-
tuk python. Psikolog harus menggunakan plot biola lebih sering.
Mereka ideal untuk menampilkan data non-normal, yang sering kita
jumpai ketika melihat kinerja peserta tunggal. Lebih penting lagi,
penelitian sebelum psikolog telah menunukan bahwa banyak men-
galami kesulitan mena sirkan gra k batang, dan plot biola menya-
jikan alternatifnya.
12
Membuat S
atter Diagram
GarisTrend Linear
Se
uler Trend adalah rata-rata perubahan dalam jangka waktu
yang panjang. Apabila menunjukan gejala kenaikan pada diagram
maka trend yng memiliki rata-rata pertambahakn yang positif. Tetapi
bila menunjukan gejala penurunan pada diagram maka trend dimiliki
menunjukan rata-rata penurunan atau negatif.
Studi Kasus
Data yang digunakan adalah data jumlah pengunjung objek wisata Kebun Raya
Cibodas dari bulan Januari 2005 hingga Desember 2009. Data selengkapnya
dapat dilihat pada Tabel 4.1 di bawah ini.
TABEL 4.1 Data Jumlah Pengunjung Umum (Domestik Dan Asing) Di Ob-
jek Wisata Kebun Raya Cibodas Periode Januari 2005 Desember 2009
Untuk menganalisis data deret berkala di atas, harus dilihat apakah ada
unsur trend, siklus, dan musimannya. Untuk mengetahui data tersebut memiliki
unsur trend, siklus dan musiman dapat dilihat pada gra k plot data, fak dan
fakp berikut ini.
Gambar 4.1 Plot data pengunjung objek wisata kebun raya Cibodas
Dari plot data pada gambar 4.1 dapat dikatakan bahwa data tersebut memi-
liki unsur trend. Selanjutnya untuk lebih jelasnya dapat dilihat pada gra k fak
dan fakp berikut.
Gambar 4.2 Gra k fak Data Pengunjung
Gambar 4.3 Gra k fakp Data Pengunjung
Dari plot fak dan fakp pada gambar 4.2 dan 4.3 di atas dapat diketahui
bahwa data tersebut membentuk trend, karena dari gra k fak terlihat menurun
se
ara lambat dan gra k fakpnya terlihat sebuah nilai fakp mendekati 1 yaitu
0,8 dan yang lainnya tidak berbeda se
ara signi kan dengan 0. Dari gambar
4.1 terlihat bahwa data memiliki unsur siklus karena pola data terulang setelah
rentang waktu yang
ukup panjang. Sementara di gambar 4.2 dan 4.3 terlihat
bahwa data memiliki pola musiman karena fak dan fakp terulang setiap satu
periode musim. Setelah melihat plot data pengunjung pada gambar 4.1 dan
gra k fak dan fakp pada gambar 4.2 dan 4.3 telah diketahui data memiliki un-
sur trend, musiman dan siklus maka data tersebut dapat diolah dengan meng-
gunakan metode dekomposisi. Langkah langkah yang harus dilakukan untuk
meramalkan data pengunjung objek wisata Kebun Raya Cibodas dengan meng-
gunakan metode dekomposisi adalah menyusun data kuartalan masing masing
tahun, membuat s
ater diagram garis trend linear, menghitung besarnya ni-
lai trend dan yang terakhir menghitung indeks musiman. Untuk memudahkan
perhitungan, penulis menggunakan software Mi
rosoft Ex
el dan SPSS 16
13
4.2 Menyusun Data Kuartalan Masing Masing Tahun
Banyaknya jumlah pengunjung umum di objek wisata dari tahun 2005 - 2009
tiap kuartal (tiga bulanan yaitu mulai : Januari Februari Maret; April
Mei Juni; Juli Agustus September; Oktober Nopember - Desember),
disajikan pada Tabel 4.2.
Tabel 4.2 Data Kuartalan Jumlah Pengunjung Umum
4.3 Membuat S
atter Diagram Garis Trend Linear
Trend (se
uler trend) adalah rata rata perubahan (tiap tahun) dalam jangka
panjang. Apabila menunjukkan gejala kenaikan maka trend yang dimiliki rata rata
pertambahan (trend positif), tetapi apabila menunjukkan gejala semakin berku-
rang maka trend yang dimiliki menunjukkan rata rata penurunan (trend negatif).
Ada beberapa metode yang biasa digunakan untuk membuat trend yaitu metode
trend linear least square, metode trend parabolik dan metode trend eksponen-
sial. Penggunaan metode tersebut disesuaikan dengan kebutuhan dan sifat data
yang dimiliki. Gra k 4.1 menunjukkan bahwa perubahan dari data tersebut
mempunyai pola normal atau letaknya mendekati garis lurus, maka trend
o
ok
digunakan. Berdasarkan data tersebut dibuat s
atter diagram dan ditambahkan
garis trend, sehingga dapat dilihat bagaimana kenormalan dari garis trend, pola
dan ke
enderungan naik atau turun, setelah itu baru dilakukan peramalan den-
gan metode dekomposisi.
Gra k 4.4 Uji normalitas jumlah pengunjung umum
Hipotesis yang digunakan untuk menguji normalitas suatu data adalah se-
bagai berikut Ho = data berdistribusi normal H1 = data tidak berdistribusi
normal Kriteria pengujian: Terima Ho jika nilai signi kan
Tabel 4.3
Uji Normalitas Jumlah Pengunjung Umum
Tests of Normality
a. Lilliefors Signi
an
e Corre
tion
*. This is a lower bound of the true signi
an
e. Nilai signi kan pada
tabel Shapiro Wilk dari tahun 2005 sampai tahun 2009 semuanya 0,05 jadi
diterima Ho yang artinya variabel Y (banyaknya jumlah pengunjung umum)
adalah normal
Tabel 4.4
Uji linearitas jumlah pengunjung umum
ANOVAb
a. Predi
tors: (Constant), THN2009, THN2006, THN2005, THN2008, THN2007
b. Dependent Variable: BULAN
4.4 Menghitung Besarnya Nilai Trend
Langkah langkah untuk menghitung besarnya nilai trend adalah sebagai
berikut: 1) Susunlah data sesuai dengan urutan tahunnya dan letakkan nilai
X sesuai dengan tahunnya. Dalam hal ini nilai X = 0, diberikan kepada data
di tahun 2007 karena data ganjil.
Tabel 4.5
Menghitung Nilai Kuadrat Terke
il Trend
Dari Data Jumlah Pengunjung Umum
14
Hitung nilai XY dan X2, kemudian
arilah jumlah Y, jumlah XY, dan
jumlah X2,
arilah nilai a dan b dengan menggunakan rumus sebagai
berikut :
Masukkan nilai a dan b pada persamaan linear. Dari langkah 2 diperoleh
persamaan trend sebagai berikut Y
= 91689.8 + 3376.7X
Setelah didapat persamaan trend maka dapat di
ari nilai trend tiap tiap
tahun dengan melakukan subtitusi nilai X pada persamaan trend.
Peramalan pada tahun yang akan datang, dilakukan subtitusi nilai X pada
tahun yang bersangkutan.
Nilai ramalan untuk tahun 2010 adalah:
Y
= 91689.8 + 3376.7(3) = 101819.9
Mengubah bentuk persamaan trend rata rata dari persamaan trend tahu-
nan apabila akan dibuat menjadi persamaan trend rata rata tiap bulan
dilakukan dengan
ara a dibagi 12 dan b dibagi 12, apabila akan dijadikan
trend rata rata tiap kuartal baik a maupun b masing masing dibagi 4,
kemudian substitusikan nilai X pada tahun yang bersangkutan sehingga
diperoleh nilai trend yang merupakan trend rata rata kuartalan adalah
:
Sehingga nilai trend rata rata untuk masing masing tahun adalah : 2005 :
22922.45 + 844.175(-2) = 21234.1
2006 : 22922.45 + 844.175(-1) = 22078.275
2007 : 22922.45 + 844.175(0) = 22922.45
2008 : 22922.45 + 844.175(1) = 23766.625
2009 : 22922.45 + 844.175(2) = 24610.8
Mengubah persamaan trend rata rata tiap kuartal menjadi trend bu-
lanan dan kuartalan. Trend bulanan adalah trend dari bulan satu ke
bulan berikutnya, menunjukkan perkiraan kenaikkan atau perubahan se-
tiap bulannya. Jadi, bukan dari tahun satu ke tahun berikutnya tetapi
dari bulan satu ke bulan berikutnya. Sedangkan trend kuartalan adalah
trend yang menunjukkan perubahan dari kuartal ke kuartal. Kalau akan
merubah persamaan trend tahunan yang satuan X satu tahun menjadi
trend bulanan maka a dibagi 12 dan b dibagi 12² sehingga kalau akan
dirubah menjadi trend kuartalan maka a dibagi 4 dan b dibagi 4² maka
persamaan trend berubah menjadi:
Tabel ini digunakan untuk menentukan nilai trend, dimana X = 0, diberikan di
data tahun 2007 pada kuartal II atau kuartal III
15
Penentuan nilai trend kuartalan seperti diatas perhitungan bukannya sulit
melainkan karena nilai X yang disubtitusikan pe
ahan bukan bilangan bulat,
untuk mempermudah originnya dapat diubah ke bilangan bulat menjadi kuar-
tal yang terdekat (kuartal II atau kuartal III). Jika originnya dirubah menjadi
kuartal II tahun 2007 maka a nya diganti dengan nilai trend pada kuartal II
sebesar 22816.93, sedangkan b nya tetap. Sehingga persamaan trendnya men-
jadi:
Y= 22816.93 + 211.04X
Tabel ini digunakan untuk menentukan trend, setelah originnya dirubah , X
= 0 diberikan di data tahun 2007 pada kuartal II
16
4.5 Menghitung Indeks Musiman Tertentu
Seperti yang telah dijelaskan pada bab III bahwa metode untuk menghi-
tung indeks musim dapat digunakan beberapa metode yaitu metode rata- rata
sederhana, metode presentase terhadap trend, dan metode presentase terhadap
rata-rata bergerak. Metode yang digunakan adalah metode rata-rata seder-
hana. Langkah langkah men
ari indeks musim dengan menggunakan metode
rata rata sederhana adalah sebagai berikut: Tabel 4.8
Data untuk Men
ari Indeks Musim
1. Menyusun data tiap kuartal untuk masing masing tahun.
2. Men
ari rata-rata tiap kuartil pada tahun 2005 sampai dengan 2009
3. Karena rata rata mengandung trend maka hilangkan pengaruh trend terse-
but (mengurangi kolom rata rata dengan b kumulatif) yang diambil dari
17
persamaan trend kuartalan sehingga mendapatkan sisanya yang diisi pada
kolom berikutnya
4. Men
ari rata rata dari kolom sisa yaitu (90411.56 : 4) = 22602.89.
5. Menyatakan angka angka pada kolom sisa sebagai presentase dari rata
ratanya, sehingga diperoleh indeks musim sebagai berkut:
Dari persamaan trend yang telah dirubah originnya yaitu
Y= 22816.93 + 211.04X
Maka diperoleh nilai trend untuk tahun 2010 adalah sebagai berikut
Kuartal I : Y
= 22816.93 + 211.04(11) = 25138.37
Kuartal II : Y= 22816.9 + 211.04(12) = 25349.41
Kuartal III : Y= 22816.93 + 211.04(13) = 25560.45
Kuartal IV : Y
= 22816.93 + 211.04(14) = 25771.49
Dengan memakai indeks musim seperti yang ter
antum pada tabel 4.8 diatas,
maka diperoleh ramalan jumlah pengunjung umum objek wisata Kebun Raya
Cibodas untuk tahun 2010 (tiap kuartal) sebagai berikut:
Jadi disini dapat terlihat jelas bahwa ramalan jumlah pengunjung umum di
objek wisata Kebun Raya Cibodas terbanyak terjadi pada kuartal IV. Jumlah
pengunjung umum di objek wisata Kebun Raya Cibodas tahun 2010 sekitar
101.828 orang, mengalami kenaikan dibandingkan pada tahun 2009 sebanyak
97.227 orang pengunjung.
18
BAB V
February 2, 2016
KESIMPULAN
Plot biola Violing Plot (Hintze dan Nelson, 1998) adalah metode peren
anaan
data numerik. Biasanya plot biola akan men
akup penanda untuk median dari
data dan kotak menunjukkan kisaran interkuartil, seperti dalam plot kotak stan-
dar.Overlay pada Box Plot ini adalah estimasi densitas kernel.Violin Plot juga
ukup mirip dengan sebuah gra k lobak yang digunakan di dalam STATA.
Plot biola tersedia sebagai ekstensi untuk sejumlah paket perangkat lunak
termasuk R melalui plot biola vioplot, wvioplot,
aroline, UsingR, Library gg-
plot2, dan sebagainyadan perpustakaan ggplot2. Grouped Violin plot with spit
violin adalah sebuah plot biola dengan gabungan beberapa plot biola dengan
menggunakan sebuah split biola.
Sebuah Violin Plot menunjukkan distribusi menggunakan lebar plot, yang
simetris pada porosnya. dalam R, vioplot () adalah perintah, yang akan digu-
nakan untuk membuat sebuah violin plot. sebuah Violin Plot memainkan peran
yang sama sebagai box dan whisker plot. ini menunjukan distribusi data kuan-
titatif di beberapa tingkat satu (atau lebih) variabel kategori seperti itu yang
terdistribusi dapat dibandingkan. disebut sebagai Violin Plot karena gambar
gra k tersebut tampak seperti sebuah biola dengan lekukan lekukan yg diben-
tuknya.
Pada dasarnya, Gruped Violin Plot with Split Violin adalah sebuah Violin
Plot dengan penggabungan beberapa Violin Plot dengan menggunakan sebuah
split violin. dalam hal lain, yaitu menggabungkan beberapa masalah anali-
tik yang memiliki data akurat untuk menghasilkan suatu kesimpulan dengan
mengkombine kedua data tersebut menggunakan split violins. apa itu split vi-
olins? Split Violins adalah teknik pada Violin Plot untuk membagi- bagi atau
memisahkan suatu kepadatan pada sebuah data masalah yang akan dikerjakan.
Berikut adalah
ontoh gambar sebuah Gruped Violin Plot with split violin.
Semua variasi boxplot dibahas sejauh mempertahankan dasar KOTAK struk-
tur, bagaimanapun, dan ini adalah salah satu keterbatasan ini tampilan data.
kesederhanaan visual mereka dapat menyembungikan banyak rin
ian penting
tentang bagaimana nilai-nilai data yang didistribusikan. Sebuah jauh lebih
eksibel perpanjangan boxpolt dasar Violin PLot dibangun dengan mengu-
1
nakan konsep boxplot dengan perkiraan kepadatan nonparamerik. Kedua Box-
plots dengan estimasi kepadatan nonparamerik dibahas dengan menjelajahi-
data, tetapi gagasan menempatkan mereka bersama-sama dalam tampilan tidak
data tunggal. Violin Plot dibahas delam hal ini adalah salah satu
ara untuk
men
apai kombinasi ini , dan dibangun dalam komponen-komponen yang sama.
Violin Plot didukung dalam R baik sebagai bagian dari paket gratis kisi dan
melalui add-on paket wvioplot.
Perangkat lunak dari plot biola yang sering digunakan adalah R software.
Bahasa R merupakan versi terbuka (open-sour
e) dari bahasa pemrograman S
(Azola dan Harrel 2006). Bahasa R memiliki kemampuan yang tidak kalah den-
gan paket-paket program pengolahan data komersial bahkan dalam beberapa
hal kemampuannya lebih baik. Bahasa R mendapatkan sambutan baik dikalan-
gan statistikawan dan ilmuwan di seluruh dunia, sayangnya di indonesia sendiri
belum banyak yg mengenalnya. Buku ini memberikan pengetahuan tentang ba-
hasa R yg merupakan sebuah software stati
open sour
e yang berguna untuk
proses analisi data, khususnya dalam memanipulasi data dan visualisasi gra k.
Kemampuan tersebut yang dipilih karena merupakan hal yang paling penting
dalam operasi data/ statisti
.
Software R pun mudah didapatkan dengan se
ara gratis, walaupun pemi-
nat analis belum banyak yang memakai software ini di Indonesia karena belum
banyaknya analis yang mempelajari software ini ataupun karena tidak ada
ketersediaannya dalam bahasa lain selain bahasa Inggris. Selanjutnya perpus-
takaan ggplot2 karena mempermudah untuk menggunakan fungsi-fungsi untuk
meren
anakan dan menyesuaikan plot biola dengan mudah. Violin Plot juga di-
gunakan dalam phyton dengan
ara yang telah diterngakan pada bab sebelum-
nya. Matlab pun dapat dipergunakan untuk membuat Violin Plot menggunakan
diagram diagram yang tersedia. satu lagi yang dapat membuat sebuah violin
plot(plot biola ) adalah Matplotlib. masing masing software dan aplikasi mem-
punyai kelebihan dan kekurangan pada saat pengaplikasiannya. tetpai untuk
di indonesia hingga saat ini, software R masih sangat diminati oleh kalangan
pemakai violin plot.
SARAN
Untuk para ilmuan atau analisis dan perguruan tinggi untuk memperkenalkan
plot biola atau (Violin Plot) ini kepada masyarakan sekitar di Indonesia dengan
perangkat lunak R dan perpustakaan ggplot untuk mempermudah peren
anaan
data numerik, hingga bukan saja hanya perangkat lunak yang seperti biasa
dipakai dengan versi yang sudah umum dengan versi bajakan seperti SPSS,SAS
dan sebagainya.
2
Daftar Pustaka
• www.r-bloggers.
om/example-8-11-violin-plots/
• www.r-bloggers.
om/split-violin-plots/
• www.sthda.
om/english/wiki/ggplot2-violin-plot-easy-fun
tion-for-data-visualization-
using-ggplot2-and-r-software
• stanford.edu/~mwaskom/software/seaborn/generated/seaborn.violinplot.html
• https://books.google.
o.id/books?id=-vyu9AaJPY8C&pg=PA19&lpg=PA19&dq=
ara+instalasi+software+R+di+harddisk&sour
• https://en.wikipedia.org/wiki/Violin_plot
• http://do
s.ggplot2.org/0.9.3/geom_violin.html
• http://www.inside-r.org/pa
kages/
ran/vioplot/do
s/vioplot
• http://julismail.sta .telkomuniversity.a
.id/tutorial-lyx/. [10 Januari 2016℄
• Pujiati, Suhermin Ari. (2010). Visualisasi Data dengan R Graphi
.[16
Januari 2016℄
• Yudistira, Anom. (2008). Manipulasi Data dan Gra k Menggunakan
Bahasa R. http://bahasa-r.blogspot.
o.id/2008/12/manipulasi-data-dan-
gra k-menggunakan.html.[16 Januari 2016℄
3
4
MOM
1 18 Januari 2016
Tempat : Universitas Gunadarma
Pembi
araan :
- Capaian : Membahas tentang bab pertama mengenai apa yang dimaksud
Violin Plot
- Ren
ana selanjutnya mengenai bagaimana Implementasi untuk bab 2 ten-
tang Violin Plot
- Pertemuan berikutnya tanggal 1
2 22 Januari 2016
Tempat : Kosan Dian Rusdianti
Pembi
araan : Membahas tentang bab kedua dan ketiga dari Violin Plot
hingga konsepnya yang akan di bahas oleh deanti dan dian.
Pertemuan berikutnya tanggal 28 Januari 2016
3 28 Januari 2016
Tempat: via WhatsApp
Pembi
araan : Membahas tentang software yang mendukung konsep violin
plot gruped violinplot with split violin.
Ren
ana pertemuan selanjutnya membahas bab 4 & 5
Pertemeuan selanjutnya tanggal 1 Februari 2016
4 1 Februari 2016
Tempat : Via Whatsapp & univ Gunadarma
mengumpulkan semua tugas yang telah diberikan kepada masing masing
anggota pada pertemuan yg telah ditentukan. dan menjadikannya kedalam
satu kesatuan.
1
|
JABATAN
|
NAMA
|
JOB DESCRIPTION
|
WORKFLOW
|
|
Wakil Ketua
|
Abigail Gabriela
|
T3
|
tulisan bab 4, bab 5, Daftar pustaka
|
|
Anggota
|
Deanti Pratami
|
T1
|
Tulisan untuk, kata pengantar bab 1 dan bab 2
|
|
Anggota
|
Dian Rusdianti
|
T2
|
Tulisan bab 3, penulisan perangkat lunak yang
mendukung perangkat lunak tersebut
|
|
Ketua
|
Satrio Nugroho
|
T0
|
Tugas persiapan , dokumen disertakan dalam
format ODF atau HTML (jangan Doc atau Xls)
|