1. Apa itu BIRCH?
Masalah utama clustering lain (K-Means, Hierarchical) adalah mereka butuh memuat SEMUA DATA ke memori (RAM). Kalau datanya ada 1 Milyar baris? RAM meledak.
BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies) menyelesaikan ini dengan cara membaca data sekali jalan (single pass) dan menyimpannya dalam struktur ringkas bernama CF Tree (Clustering Feature Tree).