Distribusi Probabilitas

Peta kemungkinan munculnya nilai data.

Distribusi Normal (Gaussian)

Distribusi paling terkenal berbentuk lonceng simetris. Banyak fenomena alam (tinggi badan, IQ, error pengukuran) mengikuti pola ini.

  • Aturan 68-95-99.7:
  • 68% data berada dalam ±1 Standar Deviasi dari Mean.
  • 95% data berada dalam ±2 Standar Deviasi.
  • 99.7% data berada dalam ±3 Standar Deviasi.

PDF & CDF

Fungsi yang menggambarkan kerapatan probabilitas. Area di bawah kurva PDF antara dua titik adalah probabilitas data jatuh di rentang tersebut. (Ini yang kita lihat sebagai kurva lonceng).

Probabilitas kumulatif bahwa variabel acak X akan bernilai kurang dari atau sama dengan x. Nilainya selalu naik dari 0 ke 1.

Generate Data Distribusi Normal dengan Python

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# 1. Generate random data (mu=0, sigma=1)
data = np.random.normal(loc=0, scale=1, size=1000)

# 2. Hitung PDF untuk nilai tertentu
# Berapa probabilitas density di x=0 (mean)?
prob_density = norm.pdf(0, loc=0, scale=1)
print(f"Density at x=0: {prob_density:.4f}") 
# Output: ~0.3989

# 3. Hitung CDF
# Berapa probabilitas nilai kurang dari 0?
prob_less_than_0 = norm.cdf(0, loc=0, scale=1)
print(f"P(X < 0): {prob_less_than_0}") 
# Output: 0.5 (Wajar, karena 0 adalah median di distribusi normal standar)