Bab 6: Probabilitas & Distribusi

Bahasa Ketidakpastian dalam Artificial Intelligence

Peta Konsep

                            graph LR
                                A[Probabilitas] --> B[Joint Probability]
                                B --> C[Marginal Probability]
                                B --> D[Conditional Probability]
                                D --> E[Bayes Theorem]
                                A --> F[Random Variable]
                                F --> G[Distribusi]
                                G --> H[Gaussian / Normal]
                            

1. Probabilitas Diskrit dan Kontinu

  • Diskrit: Variabel acak $X$ hanya bisa mengambil nilai tertentu (misal: lempar koin $\in \{H, T\}$). Kita menggunakan Probability Mass Function (PMF): $P(X=x)$.
  • Kontinu: Variabel acak $X$ bisa mengambil nilai berapapun dalam selang (misal: tinggi badan, suhu). Kita menggunakan Probability Density Function (PDF): $p(x)$.
    Ingat: Untuk variabel kontinu, probabilitas di satu titik spesifik adalah 0. Kita menghitung probabilitas dalam interval menggunakan integral: $P(a \le X \le b) = \int_a^b p(x) dx$.

2. Aturan Dasar Probabilitas

Ada dua aturan fundamental yang menjadi dasar hampir semua manipulasi probabilitas:

Sum Rule (Marginalisasi) dan Product Rule
$$ p(x) = \sum_{y} p(x, y) \quad \text{(Sum Rule - Diskrit)} $$ $$ p(x, y) = p(y|x)p(x) \quad \text{(Product Rule)} $$

3. Teorema Bayes

Jantung dari Bayesian Machine Learning. Teorema ini memberi tahu kita bagaimana memperbarui keyakinan kita (Posterior) setelah melihat data (Likelihood), berdasarkan keyakinan awal (Prior).

$$ p(\theta | \text{data}) = \frac{p(\text{data} | \theta) p(\theta)}{p(\text{data})} $$

4. Statistik Ringkasan & Distribusi Gaussian

Kadang kita hanya butuh karakteristik utama dari sebuah distribusi:

  • Mean (Nilai Harapan): $\mathbb{E}[x] = \sum x p(x)$. Pusat massa distribusi.
  • Variance (Ragam): $\text{Var}[x] = \mathbb{E}[(x - \mu)^2]$. Ukuran sebaran data.
Distribusi Gaussian (Normal)

Distribusi paling penting dalam statistik dan ML. Didefinisikan oleh Mean ($\mu$) dan Variance ($\sigma^2$).

$$ \mathcal{N}(x | \mu, \sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(x-\mu)^2}{2\sigma^2} \right) $$