Pertemuan 8

Proyek Akhir Analisis Data Menggunakan R


🎯 Tujuan Pembelajaran

Pada pertemuan terakhir ini mahasiswa akan:

  1. Menggabungkan seluruh konsep statistika yang telah dipelajari
  2. Melakukan analisis data lengkap menggunakan R
  3. Menghasilkan visualisasi dan model statistik
  4. Menyusun interpretasi hasil analisis

Pertemuan ini sepenuhnya digunakan untuk proyek akhir praktikum.


⏱️ Struktur Waktu (3 Jam)

Aktivitas Durasi


Penjelasan Proyek 30 menit
Analisis Data 1 jam 30 menit
Penyusunan Hasil 1 jam


πŸ“Š Deskripsi Proyek

Mahasiswa diminta melakukan analisis dataset nyata menggunakan R.

Tahapan analisis:

  1. Import dataset
  2. Eksplorasi data
  3. Statistik deskriptif
  4. Visualisasi data
  5. Analisis hubungan variabel
  6. Pembuatan model statistik

Dataset boleh berasal dari:

  • Kaggle
  • UCI Machine Learning Repository
  • Dataset bawaan R
  • Dataset publik lainnya

Contoh dataset yang direkomendasikan:

1
2
3
4
mtcars
iris
airquality
ToothGrowth

πŸ§ͺ Tahapan Proyek

1. Import Dataset

Jika menggunakan dataset CSV:

1
2
data <- read.csv("dataset.csv")
head(data)

Jika menggunakan dataset bawaan:

1
2
data(mtcars)
head(mtcars)

2. Eksplorasi Dataset

Lakukan eksplorasi awal:

1
2
3
str(data)
summary(data)
dim(data)

Pertanyaan:

  1. Berapa jumlah observasi?
  2. Berapa jumlah variabel?
  3. Variabel apa saja yang tersedia?

3. Statistik Deskriptif

Hitung statistik dasar:

1
2
3
mean(data$mpg)
median(data$mpg)
sd(data$mpg)

Atau gunakan:

1
summary(data)

4. Visualisasi Data

Buat minimal 3 visualisasi berbeda.

Contoh:

Histogram

1
hist(data$mpg)

Scatter Plot

1
plot(data$wt, data$mpg)

Boxplot

1
boxplot(data$mpg)

5. Analisis Hubungan Variabel

Gunakan korelasi:

1
cor(data$wt, data$mpg)

Atau korelasi matriks:

1
cor(data)

6. Model Regresi

Buat model regresi sederhana atau berganda.

Contoh:

1
2
model <- lm(mpg ~ wt + hp, data = data)
summary(model)

Interpretasikan:

  • Koefisien regresi
  • Nilai R-squared
  • Signifikansi variabel

πŸ“¦ Output yang Dikumpulkan

Mahasiswa harus mengumpulkan:

1️⃣ Script Analisis

File:

proyek_akhir.R

Berisi seluruh kode analisis.


2️⃣ Visualisasi

Minimal 3 grafik disimpan sebagai .png

Contoh:

1
2
3
png("grafik1.png")
plot(data$wt, data$mpg)
dev.off()

3️⃣ Ringkasan Analisis

Tuliskan dalam komentar pada kode:

  • Tujuan analisis
  • Variabel yang dianalisis
  • Hasil utama

πŸ“Š Kriteria Penilaian

Komponen Bobot


Import & eksplorasi data 20%
Statistik deskriptif 20%
Visualisasi 25%
Model statistik 25%
Interpretasi hasil 10%


πŸ’‘ Tips

  1. Gunakan dataset yang memiliki minimal 5 variabel
  2. Pastikan data tidak terlalu kecil
  3. Fokus pada interpretasi hasil analisis

🏁 Penutup

Selamat!

Jika seluruh pertemuan telah diikuti, mahasiswa sekarang mampu:

  • Menggunakan R untuk analisis data
  • Membuat visualisasi statistik
  • Membangun model regresi
  • Menginterpretasikan hasil analisis

Kemampuan ini merupakan dasar penting dalam data science dan machine
learning
.