Machine Learning Fundamental 5
📘 Pertemuan 5 – Supervised Learning: Classification
🎯 Tujuan Pembelajaran
Setelah mengikuti pertemuan ini mahasiswa mampu:
- Memahami konsep classification dalam machine learning
- Memahami algoritma Logistic Regression
- Memahami konsep K-Nearest Neighbors (KNN)
- Melakukan training model klasifikasi
- Mengevaluasi model menggunakan confusion matrix dan classification metrics
1️⃣ Apa itu Classification?
Classification adalah metode supervised learning yang digunakan untuk memprediksi kelas atau kategori.
Contoh kasus:
| Kasus | Target |
|---|---|
| Spam detection | Spam / Not Spam |
| Diagnosis penyakit | Positif / Negatif |
| Kelulusan mahasiswa | Lulus / Tidak |
| Fraud detection | Fraud / Normal |
2️⃣ Dataset Contoh
Kita akan menggunakan dataset Titanic untuk memprediksi apakah penumpang selamat atau tidak.
1 | import pandas as pd |
Target
1 | survived |
3️⃣ Data Preparation
Memilih fitur yang akan digunakan
1 | df = df[['survived','pclass','sex','age','fare']] |
Encoding data kategorikal:
1 | from sklearn.preprocessing import LabelEncoder |
4️⃣ Train Test Split
1 | from sklearn.model_selection import train_test_split |
5️⃣ Logistic Regression
Logistic Regression digunakan untuk binary classification.
Persamaan sigmoid:
P(y=1) = \frac{1}{1 + e^{-z}}
Implementasi:
1 | from sklearn.linear_model import LogisticRegression |
6️⃣ K-Nearest Neighbors (KNN)
KNN bekerja dengan mencari tetangga terdekat.
Langkah algoritma:
- Pilih nilai K
- Hitung jarak ke data lain
- Ambil K tetangga terdekat
- Gunakan voting mayoritas
Implementasi:
1 | from sklearn.neighbors import KNeighborsClassifier |
7️⃣ Evaluasi Model
Accuracy
1 | from sklearn.metrics import accuracy_score |
Confusion Matrix
Confusion matrix menunjukkan performa klasifikasi.
| Predicted No | Predicted Yes | |
|---|---|---|
| Actual No | TN | FP |
| Actual Yes | FN | TP |
1 | from sklearn.metrics import confusion_matrix |
Classification Report
1 | from sklearn.metrics import classification_report |
Metric yang ditampilkan:
- Precision
- Recall
- F1 Score
- Accuracy
8️⃣ Visualisasi Confusion Matrix
1 | import seaborn as sns |
🧪 Praktikum Lengkap
1 | import pandas as pd |
📝 Tugas Praktikum
- Gunakan dataset Titanic.
- Lakukan:
- preprocessing
- logistic regression
- KNN
- Bandingkan akurasi kedua model.
📝 Tugas Mandiri
- Ambil dataset klasifikasi dari Kaggle.
- Lakukan:
- EDA
- preprocessing
- classification model
- evaluasi model
- Gunakan template laporan berikut:
https://github.com/AzharRizkiZ/Template-DS-ML - Upload proyek ke GitHub repository masing-masing.
🎓 Target Kompetensi
Mahasiswa mampu:
- Memahami konsep classification
- Mengimplementasikan logistic regression
- Menggunakan KNN
- Mengevaluasi model klasifikasi
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.
Comments



