Part 5: Performance Metrics

Rapor Kinerja AI: Tidak Sekadar Akurasi

1. Confusion Matrix

Untuk memahami kinerja model klasifikasi (Contoh: Menentukan Pasien Sakit Covid atau Sehat), kita pakai Confusion Matrix.

Prediksi AI
Kenyataan
Positif (Sakit) Negatif (Sehat)
TP True Positive Benar: Dia Sakit
FN False Negative Salah: Dibilang Sehat (Bahaya!)
FP False Positive Salah: Dibilang Sakit (Panik)
TN True Negative Benar: Dia Sehat

2. Metrics Utama

Dari kotak-kotak di atas, kita bisa menghitung:

Accuracy

"Seberapa sering AI benar?"

$$ \frac{TP + TN}{Total} $$
Jangan pakai jika data tidak seimbang (Imbalanced Data).
Precision

"Saat AI bilang Ya, seberapa jitu?"

$$ \frac{TP}{TP + FP} $$

Penting untuk filter Spam (Jangan sampai email penting masuk spam).

Recall (Sensitivity)

"Dari semua yang Positif, berapa yang ketemu?"

$$ \frac{TP}{TP + FN} $$

Penting untuk Deteksi Kanker (Jangan sampai ada yang sakit tapi terlewat).

F1-Score

"Jalan tengah Precision & Recall"

$$ 2 \cdot \frac{Precision \cdot Recall}{Precision + Recall} $$

Metrik terbaik untuk dataset yang tidak seimbang.

Model Anda "Cerdas" atau "Menghafal"?

Akurasi tinggi saat latihan belum tentu bagus saat ujian asli. Hati-hati dengan jebakan Overfitting.

Lanjut ke Part 6: Overfitting & Regularization