Part 19: Transfer Learning

Berdiri di Atas Bahu Raksasa

1. Jangan Mulai dari Nol!

Jika Anda ingin membuat AI pendeteksi "Lontong vs Lemper", Anda tidak perlu melatih CNN dari awal (random weights). Itu butuh jutaan gambar dan GPU mahal.

Solusi: Ambil model yang sudah dilatih oleh Google/Meta (misal: ResNet, EfficientNet) yang sudah melihat 14 juta gambar (ImageNet). Model ini sudah paham apa itu "garis", "lingkaran", "tekstur". Kita tinggal ajari bedanya Lontong dan Lemper.

2. Model Populer untuk "Dipinjam"

Computer Vision
  • ResNet50 / 101
  • EfficientNet (B0 - B7)
  • MobileNet (Untuk HP)
  • YOLO (Object Detection)
NLP (Teks)
  • BERT (Google)
  • GPT-2 (OpenAI)
  • RoBERTa (Facebook)
  • DistilBERT (Versi Ringan)
Audio
  • Wav2Vec 2.0
  • Whisper (OpenAI)
  • YamNet

3. Strategi Fine-Tuning

Matikan training (freeze) untuk semua layer kecuali layer terakhir (Output Layer).

base_model.trainable = False

Setelah output layer pintar, cairkan (unfreeze) beberapa layer atas dari base model, lalu latih dengan Learning Rate yang sangat kecil.

Model Sudah Jadi! Disimpan Dimana?

Jangan biarkan model hilang di memori RAM. Kita harus menyimpannya agar bisa dipakai nanti (Inference). Format apa yang terbaik? .h5? .pt? .onnx?

Lanjut ke Part 20: Model Management