Part 4: How Training Works

Terminologi & Proses Pelatihan

1. Loop Pelatihan (Epoch, Batch, Iteration)

Kita tidak bisa memberi makan 1 juta data sekaligus ke komputer (Memori tidak cukup). Kita harus memecahnya.

Epoch

"Satu putaran penuh"


Ketika AI sudah melihat SELURUH dataset belajar satu kali. (Biasanya butuh puluhan/ratusan epoch agar pintar).

Batch Size

"Sekali lahap"


Jumlah data yang diproses sebelum update weight (Optimization). Contoh: 32 gambar per batch.

Iteration

"Jumlah langkah"


Berapa kali update weight terjadi dalam 1 Epoch. $$ \text{Iterasi} = \frac{\text{Total Data}}{\text{Batch Size}} $$

2. Pembagian Data (Train / Val / Test)

Ini adalah Hukum Emas Machine Learning: "Jangan pernah menguji dengan data yang sudah dipelajari!"

Training Set (70%)
(Buku Pelajaran)
Validation (15%)
(Try Out)
Test (15%)
(Ujian Nasional)
  • Training Data: Digunakan untuk Backpropagation (Update bobot). AI boleh melihat ini.
  • Validation Data: Digunakan untuk mengecek performa SAAT training. Tidak dipakai update bobot, tapi dipakai untuk menyetel Hyperparameter.
  • Test Data: Data sakral. Hanya dibuka SETELAH semua proses selesai untuk mengukur performa akhir.

3. Kurva Loss (Loss Curve)

Untuk mengetahui apakah training berhasil, kita melihat grafik Loss vs Epoch.

Loss Curve Example
Epochs Loss
Tujuan Kita

Grafik harus turun landai seiring berjalannya Epoch.

Jika grafik:

  • Tetap datar: Model tidak belajar (Cek Learning Rate).
  • Naik turun gila: Learning Rate terlalu besar.
  • Naik terus: Ada yang salah (Bug).

Paham Prosesnya?

Sekarang kita tahu bagaimana proses belajar. Tapi bagaimana kita tahu modelnya "Pintar"?

Lanjut ke Part 5: Evaluation Metrics