Sunday, January 13, 2019

#Belajar-R : Analisis Deskriptif


Salah satu analisis deskriptif yang paling familiar adalah pemusatan data. Ukuran pemusatan atau ukuran lokasi adalah beberapa ukuran yang menyatakan dimana distribusi data tersebut terpusat. Ada tiga metode untuk mengukur pemusatan data, yaitu rata-rata (mean), median, dan modus. Tentunya dari setiap metode tersebut masing-masing mempunyai kelebihan dan kekurangannya. Selengkapnya anda bisa simak di postingan …...

Okay, langsung saja kita praktikkan. Data yang akan kita gunakan dapat diunduh di  Download Data.

Setelah selesai mendownload data, langsung saja buka aplikasi R dan import data tersebut. Cara mengimport file data dapat anda simak di postingan saya #BELAJAR-R : MANAJEMEN DATA.

Data yang telah di import
Data tersebut adalah data nilai Bahasa Inggris, Matematika, dan Biologi dari 71 siswa. Pertama-tama, kita akan menghitung mean, median, dan quantil dari nilai mata pelajaran Bahasa Inggris.

Adapun beberapa fungsi yang akan kita gunakan adalah:

  1. Rata-rata (mean)

           >mean(nama_data_frame$nama_variabel)

      2. Median
          >median(nama_data_frame$nama_variabel)
       
      3. Quantile
         >quantile(nama_data_frame$nama_variabel)

Contoh mencari ukuran pemusatan dengan menggunakan R.


Ingat! nama variabel yang ditulis dalam fungsi harus sama persis dengan nama variabel yang tertera dalam data frame. Jika tidak sama persis (huruf besar kecilnya, ejaannya, dll), maka fungsi tersebut akan gagal mengeluarkan output yang kita inginkan. Saya mencontohkan seperti fungsi ke tiga >quantile(semester$english). Fungsi tersebut tidak mengeluarkan output yang saya inginkan karena ejaan dalam variabelnya salah, yang seharusnya English, disitu malah saya tulis english.

Selanjutnya, jika kita ingin mengetahui nilai tertinggi atau terendah di mata pelajaran Bahasa Inggris, kita bisa menggunakan fungsi max dan min.

        1. >max(nama_data_frame$nama_variabel)
        2. >min(nama_data_frame$nama_variabel)

Selanjutnya, kita juga sekaligus dapat mengetahui siapa yang mempunyai nilai Bahasa Inggris tertinggi melalui fungsi:

        1.  >rownames(nama_data_frame)[which.max(nama_data_frame$nama_variabel] 
        2.  >rownames(nama_data_frame)[which.min(nama_data_frame$nama_variabel] 

Dengan mengembangkan fungsi max-min, kita dapat mengetahui sipa orang yang mempunyai nilai tersebut.

Namun, masih ada kekurangan dengan fungsi which.max. Fungsi ini hanya mengeluarkan output 1 objek saja. Padahal ada beberapa orang yang mendapatkan nilai 97 ataupun 34. Siswa yang ditampilkan oleh which.max adalah siswa yang urutannya paling atas yang mempunyai nilai 97. 

R juga menyediakan fungsi summary yang dapat menampilkan ringkasan analisis deskriptif dari semua variabel.


Kita disajikan sebuah ringkasan analisis deskriptif sederhana dari ke lima variabel yang akan kita teliti, mulai dari nilai minimal, quantil 1, median, rata-rata, kuantil ke 3, dan nilai maksimal. Tentunya tabel tersebut sangat membantu untuk mengetahui gambaran ringkas mengenai variabel-variabel yang kita telitil.

Agar lebih memahami aplikasi R, silakan membaca-baca postingan mengenai #BelajarR di blog ini. Terimakasih.

Daftar Pustaka

Pramana, Setia, dkk.2017.Dasar-Dasar Statistika dengan Software R Konsep dan Aplikasi Edisi ke Dua.Bogor.In Media.
Budiharto, Widodo dan Rachmawati, Ro’fah.2013.Pengantar Praktis Pemrogaman R untuk Ilmu Komputer.Jakarta.Halaman Moeka.
Maindonald, J.H.2008.Using R for Data Analysis and Graphics Introduction, Code and Commentary.Australia.Australian National University



0 comments:

Post a Comment