Modul 4: Loss Function

Menilai Seberapa "Bodoh" Model Kita Saat Ini

📉 Mengapa Kita Butuh "Kerugian"?

Tujuan utama Neural Network adalah membuat prediksi yang akurat. Tapi saat pertama kali dijalankan (inisialisasi), bobot-bobot ($W$) diisi secara acak. Jadi, prediksinya pasti salah besar (ngawur).

Untuk memperbaiki diri, model harus tahu seberapa salah dia. Nilai kesalahan ini disebut Loss atau Cost.

Analogi: Ujian Sekolah

Prediksi ($\hat{y}$): Jawaban kamu di lembar ujian.
Target ($y$): Kunci jawaban dari guru.
Loss ($L$): Nilai merah atau poin yang dikurangi karena jawaban salah.

Tujuan kita adalah meminimalkan Loss (mendapatkan nilai merah sesedikit mungkin).

📏 Jenis-Jenis Loss Function

Tergantung masalahnya, cara kita menghitung error berbeda-beda.

1. Mean Squared Error (MSE)

Untuk Regresi (Angka)

Kita menghitung selisih kuadrat antara prediksi dan target.

L = \frac{1}{2} (\hat{y} - y)^2

Kenapa dikuadratkan? Agar error negatif (-5) dan positif (5) tidak saling meniadakan, dan agar error besar dihukum lebih berat.

2. Binary Cross-Entropy

Untuk Klasifikasi (Ya/Tidak)

Rumusnya terlihat agak menyeramkan, tapi efektif untuk probabilitas.

L = - [y \log(\hat{y}) + (1 - y) \log(1 - \hat{y})]

Jika target $y=1$ tapi prediksi $\hat{y} \approx 0$, nilai Log-nya akan meledak (Loss sangat besar). Ini memaksa model untuk sangat yakin.

Contoh Perhitungan: Seberapa Besar Errornya?

Kasus 1: MSE (Harga Rumah)

Target ($y$): 1000 Juta
Prediksi ($\hat{y}$): 500 Juta

L = \frac{1}{2} (500 - 1000)^2 $$ $$ L = \frac{1}{2} (-500)^2 $$ $$ L = \frac{1}{2} (250.000) = 125.000

Error sangat besar! Kita perlu ubah bobot secara drastis.

Kasus 2: Log Loss (Gambar Kucing)

Target ($y$): 1 (Ini Kucing)

Skenario A (Tebakan Benar): Prediksi 0.9

$ L = - \log(0.9) \approx 0.10 $ (Error Kecil)

Skenario B (Tebakan Salah): Prediksi 0.1

$ L = - \log(0.1) \approx 2.30 $ (Error Besar!)

🏔️ Cost Function (J)

Loss ($L$) adalah error untuk satu data saja. Tapi kita punya ribuan data latih. Rata-rata dari semua Loss disebut Cost Function ($J$).

J(W, b) = \frac{1}{m} \sum_{i=1}^{m} L(\hat{y}^{(i)}, y^{(i)})

Visualisasi Error Surface

Kita ingin bola merah turun ke titik hijau (Lembah Minimum).

Bagaimana Cara Turun Gunung?

Kita sudah tahu kita ada di puncak gunung (error tinggi). Tapi jalan mana yang harus kita ambil untuk turun ke lembah? Kita tidak bisa melihat (karena dimensinya jutaan). Kita hanya bisa meraba kemiringan tanah. Inilah yang akan kita bahas di modul pamungkas: Backpropagation & Gradient Descent.

Modul 3: Forward Propagation Lanjut ke Modul 5