Modul 2: Statistik Dasar

Mengenal Data: Pusat dan Penyebarannya

🎯 Ukuran Pemusatan (Central Tendency)

Cara paling cepat untuk "merangkum" ribuan data menjadi satu angka.

Mean (Rata-rata)

Total jumlah dibagi banyaknya data. Sangat sensitif terhadap outlier (data pencilan).

$\mu = \frac{\sum x}{n}$
Median (Tengah)

Nilai tengah setelah data diurutkan. Lebih tahan banting terhadap outlier.

Mode (Modus)

Nilai yang paling sering muncul. Berguna untuk data kategori.

📏 Sebaran Data (Standard Deviation)

Rata-rata saja bisa menipu. Kita butuh tahu seberapa "menyebar" datanya. Ini adalah dasar dari Normalisasi / Standarisasi Data di AI.

$$ \sigma = \sqrt{\frac{\sum (x - \mu)^2}{n}} $$