九年前的問答,內容照搬。
發問時間: 2013-01-04 23:22:08
請問二項分配.幾何分配.超幾何分配.柏松分配的差別
能不能說出這4個的差別.使用時機.公式
回答時間: 2013-01-05 01:13:13
幾何分布與負二項分布是二項試驗的 "等待時間" 問題, 因此它和二項分布有關, 卻不很適合談 "差別".
明確地說, 二項分布是固定 n 次獨立二項試作 (independent Bernoulli trials) 的總合結果 (有 x 次成功, n-x 次失敗) 的機率分布; 而幾何分布是在這樣的實驗中, 要經多少次 "失敗" 或等候多少次 trials 才能看到一次成功的機率分布.
我們來看二項分布、超幾何分布與 Poisson 分布的異同.
就二項分布與超幾何分布而言,
(1) 它們都是執行固定 n 次的 Bernoulli trials. 但
(2) 二項分布每一次 trial 的成功機率都是 p; 而超幾何分布每一次 trial 成功的機率會受先前 trials 成功/失敗次數所影響. 故超幾何分布需要以 "抽球" 問題來解釋, 假設袋中有 N 個球, 其中 A 個代表 "成功". 在第 k 次抽球 (k'th trial) 時, 若先前成功 r 次, 則此次成功機率是 (A-r)/(N-k+1).
就二項分布與 Poisson 分布而言,
(1) 二項分布可以用 independent Bernoulli trials 來說明; 而 Poisson 分布則用 Poisson process 來說明.
(2) 二項分布是在累積 "成功" 次數; 而 Poisson 分布是在累積某種 "事故"(或稱 "事件") 次數.
(3) 二項分布的 Bernoulli trials 有明確的區隔, 即一次一次地做; Poisson process 沒有明確的 "次" 的區隔, 它可能是在一段時間或在一片區域中點計 "事故" 數.
(4) 二項分布的 Bernoulli trials 每一次 trial 其 "成功" 機率與先前的結果無關, 所以是 independent trials; Poisson process 有 "獨立增量" 條件, 也就是不相重疊的時間區段或地區分塊其 "事故" 數相互獨立.
(5) 二項分布的 "成功數" 是固定做 n 次 Bernoulli trials 的結果; Poisson 分布的 "事故數" 是固定長度時間或固定大小的地理區塊的結果.
(6) 由於 Poisson process 沒有明確的 "次" 的區隔, 因此可以把時間區段或地理區塊或類似的實驗範圍做任意細分, 並且在分割得很細的時間微小片段或地理上的微小區塊假設發生(發現) "事故" 的機率做假設: 在微小區段...
(a) 發生二次 "事故" 以上的機率可以忽略;
(b) 發生一次 "事故" 的機率與區段(區塊)大小可以說成比例. 事實上這相當於說: 如果把 Poisson 分布所考慮的時間段或地理區域或類似目標範圍等分成 n 份, n 很大, 則幾乎可以把它看成是一個 independent Bernoulli trial. 也就是說, Poisson 分布被假設為可以用 n 很大, p 很小的二項分布近似.
至於使用時機, 由上列各分布的說明應該可以得知.
例如: 一本書中的錯誤數, 可以看成是一個 Poisson 過程的結果.
例如: 丟銅板 n 次問正面次數的機率, 這是典型二項分布問題.
例如: 問要丟幾次銅板才能看到一次正面; 又如: 要擲幾次筊才能得到一次 "聖筊"; 例如在街上找人要找幾個人才能碰到一個 18-22 歲的女孩等等, 都是幾何分布問題.
例如, 從一副標準撲克牌連續抽牌 (抽出後不放回去), 抽5張可以得到的花牌數. 例如, 從一批200個產品抽20個, 其中會有多少不良品. 這些都是典型的超幾何分布問題.