Pertemuan 2

Statistika Deskriptif dan Visualisasi Data


1. Tujuan Pembelajaran

Setelah mengikuti pertemuan ini, mahasiswa mampu:

  1. Menghitung ukuran statistika deskriptif menggunakan R
  2. Menjelaskan makna mean, median, dan standar deviasi
  3. Membuat visualisasi data dasar (histogram, boxplot)
  4. Menginterpretasikan hasil statistik dan grafik

2. Materi Inti (± 1 Jam)

2.1 Statistika Deskriptif

Statistika deskriptif digunakan untuk meringkas dan menggambarkan data tanpa menarik kesimpulan umum.

Ukuran yang sering digunakan:

  • Mean (rata-rata)
  • Median (nilai tengah)
  • Minimum dan maksimum
  • Standar deviasi (penyebaran data)

Contoh perhitungan menggunakan R:

1
2
3
4
5
mean(data$nilai)
median(data$nilai)
min(data$nilai)
max(data$nilai)
sd(data$nilai)

2.2 Ringkasan Data dengan summary()

Fungsi summary() memberikan gambaran cepat tentang data.

1
summary(data)

Output ini sangat penting untuk eksplorasi awal data.


2.3 Visualisasi Data

Visualisasi membantu kita memahami:

  • Pola data
  • Penyebaran
  • Nilai ekstrem (outlier)

a. Histogram

1
2
3
4
5
6
7
library(ggplot2)

ggplot(data, aes(x = nilai)) +
geom_histogram(binwidth = 5, fill = "steelblue") +
labs(title = "Histogram Nilai",
x = "Nilai",
y = "Frekuensi")

b. Boxplot

1
2
3
ggplot(data, aes(y = nilai)) +
geom_boxplot(fill = "orange") +
labs(title = "Boxplot Nilai")

3. Praktikum dan Tugas (⏱️ ± 2 Jam)

Gunakan dataset hasil pertemuan 1 atau dataset lain yang relevan.


Tugas 1 — Statistika Deskriptif Dasar (±30 menit)

  1. Hitung:
    • Mean
    • Median
    • Minimum
    • Maksimum
    • Standar deviasi
      untuk setiap variabel numerik.
  2. Catat hasilnya.

Tugas 2 — Perbandingan Kelompok (±30 menit)

  1. Kelompokkan data berdasarkan:
    • Kelas / Jenis kelamin / Kategori lain
  2. Hitung mean nilai untuk setiap kelompok.

Contoh:

1
aggregate(nilai ~ kelas, data = data, mean)


Tugas 3 — Visualisasi Data (±40 menit)

  1. Buat:
    • Minimal 1 histogram
    • Minimal 1 boxplot
  2. Ubah:
    • Judul grafik
    • Label sumbu
  3. Simpan grafik sebagai file gambar (.png).
1
ggsave("output/histogram_nilai.png")

Tugas 4 — Interpretasi (±20 menit)

Jawab pertanyaan berikut:

  1. Bagaimana bentuk distribusi data?
  2. Apakah terdapat outlier?
  3. Apakah mean dan median memiliki nilai yang jauh berbeda?
  4. Apa kesimpulan awal yang dapat Anda tarik dari data?

Tuliskan jawaban dalam komentar R atau file laporan singkat.


4. Output yang Dikumpulkan

  1. Script R (pertemuan2.R)
  2. File gambar hasil visualisasi
  3. Jawaban interpretasi

5. Penutup

Statistika deskriptif adalah langkah pertama dan paling penting dalam analisis data.

Pada pertemuan berikutnya, kita akan membahas:

  • Distribusi probabilitas
  • Sampling dan simulasi data menggunakan R