1. Monte Carlo vs TD Learning
Bayangkan Anda ingin memprediksi cuaca hari Jumat. Hari ini Senin.
Monte Carlo (MC)
Anda menunggu sampai hari Jumat benar-benar datang. Baru Anda update prediksi Senin Anda.
Temporal Difference (TD)
Hari Selasa hujan. Anda langsung update prediksi Senin Anda: "Wah, ternyata Selasa hujan, berarti kemaren prediksi Senin saya salah".