R for Statistics 2
Pertemuan 2
Statistika Deskriptif dan Visualisasi Data
1. Tujuan Pembelajaran
Setelah mengikuti pertemuan ini, mahasiswa mampu:
- Menghitung ukuran statistika deskriptif menggunakan R
- Menjelaskan makna mean, median, dan standar deviasi
- Membuat visualisasi data dasar (histogram, boxplot)
- Menginterpretasikan hasil statistik dan grafik
2. Materi Inti (± 1 Jam)
2.1 Statistika Deskriptif
Statistika deskriptif digunakan untuk meringkas dan menggambarkan data tanpa menarik kesimpulan umum.
Ukuran yang sering digunakan:
- Mean (rata-rata)
- Median (nilai tengah)
- Minimum dan maksimum
- Standar deviasi (penyebaran data)
Contoh perhitungan menggunakan R:
1 | mean(data$nilai) |
2.2 Ringkasan Data dengan summary()
Fungsi summary() memberikan gambaran cepat tentang data.
1 | summary(data) |
Output ini sangat penting untuk eksplorasi awal data.
2.3 Visualisasi Data
Visualisasi membantu kita memahami:
- Pola data
- Penyebaran
- Nilai ekstrem (outlier)
a. Histogram
1 | library(ggplot2) |
b. Boxplot
1 | ggplot(data, aes(y = nilai)) + |
3. Praktikum dan Tugas (⏱️ ± 2 Jam)
Gunakan dataset hasil pertemuan 1 atau dataset lain yang relevan.
Tugas 1 — Statistika Deskriptif Dasar (±30 menit)
- Hitung:
- Mean
- Median
- Minimum
- Maksimum
- Standar deviasi
untuk setiap variabel numerik.
- Catat hasilnya.
Tugas 2 — Perbandingan Kelompok (±30 menit)
- Kelompokkan data berdasarkan:
- Kelas / Jenis kelamin / Kategori lain
- Hitung mean nilai untuk setiap kelompok.
Contoh:1
aggregate(nilai ~ kelas, data = data, mean)
Tugas 3 — Visualisasi Data (±40 menit)
- Buat:
- Minimal 1 histogram
- Minimal 1 boxplot
- Ubah:
- Judul grafik
- Label sumbu
- Simpan grafik sebagai file gambar (
.png).
1 | ggsave("output/histogram_nilai.png") |
Tugas 4 — Interpretasi (±20 menit)
Jawab pertanyaan berikut:
- Bagaimana bentuk distribusi data?
- Apakah terdapat outlier?
- Apakah mean dan median memiliki nilai yang jauh berbeda?
- Apa kesimpulan awal yang dapat Anda tarik dari data?
Tuliskan jawaban dalam komentar R atau file laporan singkat.
4. Output yang Dikumpulkan
- Script R (
pertemuan2.R) - File gambar hasil visualisasi
- Jawaban interpretasi
5. Penutup
Statistika deskriptif adalah langkah pertama dan paling penting dalam analisis data.
Pada pertemuan berikutnya, kita akan membahas:
- Distribusi probabilitas
- Sampling dan simulasi data menggunakan R
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.
Comments



