1. Apa itu Q-Learning?
Berbeda dengan Supervised Learning (dikasi kunci jawaban) atau Unsupervised (cari pola), Reinforcement Learning (RL) belajar seperti bayi atau hewan peliharaan: melalu Sistem Reward (Hadiah) & Punishment (Hukuman).
Q-Learning adalah algoritma RL klasik di mana Agent belajar nilai kualitas (Quality / Q-Value) dari setiap tindakan di setiap keadaan.
- Agent: Yang belajar (Robot/AI).
- Environment: Dunia tempat agent hidup (Labirin/Game).
- State ($S$): Posisi agent saat ini.
- Action ($A$): Apa yang dilakukan (Atas, Bawah, Kiri, Kanan).
- Reward ($R$): Nilai balik (+100 dapet Emas, -100 kena Api).