Machine Learning Fundamental 2
Pertemuan 2: Exploratory Data Analysis (EDA)
🎯 Tujuan Pembelajaran
Setelah mengikuti pertemuan ini, mahasiswa diharapkan mampu:
- Memahami konsep dan tujuan Exploratory Data Analysis (EDA)
- Membaca dan memahami struktur dataset
- Mengidentifikasi missing value dan outlier
- Membuat visualisasi data dasar
- Mendokumentasikan hasil EDA dalam bentuk laporan
📘 Materi
1. Pengertian Exploratory Data Analysis (EDA)
Exploratory Data Analysis (EDA) adalah proses awal dalam analisis data untuk memahami:
- Struktur data
- Pola dan hubungan antar fitur
- Anomali atau kesalahan data
EDA dilakukan sebelum preprocessing dan pemodelan machine learning.
2. Statistik Deskriptif
Statistik deskriptif digunakan untuk melihat gambaran umum dataset.
Beberapa fungsi penting di pandas:
head()dantail()info()describe()
Statistik dasar yang perlu dipahami:
- Mean (rata-rata)
- Median
- Minimum dan maksimum
- Standar deviasi
3. Visualisasi Data
Visualisasi membantu memahami data secara intuitif.
Jenis visualisasi dasar:
- Histogram → distribusi data
- Boxplot → mendeteksi outlier
- Scatterplot → hubungan antar fitur
- Heatmap korelasi → hubungan antar fitur numerik
4. Permasalahan Umum pada Dataset
- Missing value
- Outlier
- Distribusi tidak normal
- Ketidakseimbangan data (imbalance)
🔧 Latihan Praktik
A. Import Library dan Dataset
1 | import pandas as pd |
B. Eksplorasi Awal Dataset
1 | df.head() |
C. Visualisasi Data
1 | # Histogram usia |
Tugas Mandiri
- Lakukan Exploratory Data Analysis (EDA) pada dataset Titanic.
- Identifikasi:
- Kolom yang memiliki missing value
- Kolom yang memiliki outlier
- Buat minimal:
- 1 histogram
- 1 boxplot
- 1 heatmap korelasi
- Buat laporan menggunakan template berikut:
https://github.com/AzharRizkiZ/Template-DS-ML - Upload notebook dan laporan ke GitHub.
Tugas Tambahan
- Ambil dataset bebas dari Kaggle.
- Lakukan EDA lengkap (statistik + visualisasi).
- Buat laporan menggunakan template yang sama.
- Upload hasil ke GitHub.
Referensi
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.
Comments



