1. Evolusi Optimizer
SGD itu ibarat orang buta menuruni gunung dengan langkah kecil. Lambat dan sering tersangkut di lembah lokal (Local Minima). Kita butuh alat yang lebih canggih.
Momentum
"Seperti bola menggelinding."
Mempertahankan kecepatan dari langkah sebelumnya. Jika arahnya sama, makin
cepat!
RMSprop
"Adaptive Learning Rate."
Jalan curam? Pelankan langkah. Jalan datar? Percepat langkah.
Adam
"Momentum + RMSprop"
Raja dari segala optimizer saat ini. Cepat, stabil, dan adaptif.
(Adaptive Moment Estimation)