本文要談的是一個小問題:條件機率 P{B|A} 和條件機率 P{B|X}(或 P{B|σ(X)})意義上的差別。
條件機率的定義及說明見之於「 條件機率與條件期望值 」一文,不過該文較偏向於數學定義,但雖知道 P{B|A} 之類的條件機率就是機率,甚至固定 A 而 B 可允許是任意事件時,P{.|A} 變成在「新樣本空間」 A (之上的事件集)的一個機率分布(機率函數)。另一方面, P{B|X} 之類的條件機率,雖有機率之名與形(符合機率性質),本質卻是定義在樣本空間 S 上的實數值點函數,更明確地說,是把 S 上一點 ω 映至 [0, 1] 之一點的函數。為什麼會這樣?
考慮機率空間 (S, F, P) 上的一個事件 A,則 P{B|A} 是「如果已知 A 發生了,那麼事件 B 也發生的條件機率是多少?」它的意思有兩種:
其一:做一個隨機實驗,機率空間如上,已知事件 A 發生,問有這情報以後 B 事件發生的機率應如何評估?
其二:在前述機率空間先做一次隨機實驗,結果 A 事件發生;再做相同隨機試驗,但如果 A 不發生則作廢重做實驗,問結果 B 發生的機率。
以抽撲克牌為例,去除大小鬼牌則有 52 張牌。抽出一張,已知是紅心,在此情報下評估此牌是人像 (J, Q, K) 的機率。這是第一種情況,事件 A 是抽得的為紅心,事件 B 是抽得的為人像。在「已知 A 發生」之下談事件 B 的機率,則 P{B|A} 比單純的 P{B} 更適當。
若抽得紅心後,把牌放回,重新洗過。重新抽牌,若不是紅心,則放回再重新洗牌,重新抽牌,直至抽得的是紅心,問最後得的是人像的機率。還有另一個方式是:在第一次抽得紅心後,把紅心牌都挑出,洗勻,而後抽牌,問這樣操作下抽得的是人像的機率。
以上各種情形都導致條件機率的定義是
P{B|A} = P{B∩A}/P{A}
而其意義是:改以 A 為樣本空間來考慮機率。機率本就是事件與樣本空間之某種測度值的比較,因此樣本空間得 P{S} = 1,而稱之為必然事件;在條件機率則當 B 包含 A 時 P{B|A} = 1。從古典機率之機率設定、統計頻率之機率設定、以至於 Kolmogorov 以一般有限測度為基礎,條件機率 P{B|A} 之定義唯有如上定義式才合理,才符合一致性。而不管是一次實驗,或分段實驗,P{B|A} 都是把 A 當成所謂條件機率的新的樣本空間。
由事件 A,事實上可以導出一個事件族 A = {φ, A, A', S}, 它是 F 的事件子族。這裡稱「事件族」指它們 (F 和 A) 各自是一個 σ-體,或譯 σ-場。那麼,P{E|A} 是什麼意思?首先我們可以猜想:
P{E|A} 是不是代表 P{E|A}, P{E|A'} 呢?或加上 P{E|S} = P{E}?
同樣,由事件 A, B, 可以將 S 分割成 4 個部分:A∩B, A∩B', A'∩B, A'∩B'。依習慣,"∩" 符號可以省略,並且在運算順序上補集 (') 先於交集 (∩) 先於聯集 (∪),則由 A, B 產生的最小事件族
G = {φ, A, A', B, B', AB, AB', A'B, A'B', AB∪A'B', A'B∪AB',
(AB)', (A'B)', (AB')', A∪B, S}
那麼 P{E|G} 是指給定 A, B 等由 A, B 之補集、交集與聯集所形成 15 個事件(除空事件 φ 以外)的條件機率嗎?這有兩點不妥:
1. 給定一個 σ-體 G, 或給定一個隨機變數 X,P{E|G} 或 P{E|X} 顯然意義上和給定一個事件 A 的條件機率 P{E|A} 不同,似乎也不合適看成是一堆給定某事件之條件機率的總體。
2. 給定一個 σ-體 G, 或給定一個隨機變數 X,其中所含的事件太多。例如前述由兩事件 A 與 B 得 S 分割成 4 個郭分,但卻產生了 15 個非空事件。
給定一個 σ-體 G, 或給定一個隨機變數 X,約略相當於對樣本空間 S 的分割。例如由 A, B 兩事件產生的 G 有 16 個成員,但它們實際上是由 S 的 4 個分割事件 AB, AB', A'B, A'B' 所構成。如果要用「給定某個事件的條件機率」來解釋「給定一個事件族訊息的條件機率」,我們是否可用「給定各個分割事件的各條件機率的整體」來解釋更好?
以前面的事件族 A = {φ, A, A', S} 為例,我們有下列「全機率」公式,或稱全機率定理:
P{E} = P{E|A} P{A} + P{E|A'} P{A'}
如果我們定義一個函數
f(ω) = P{E|A} 當 ω in A; = P{E|A'} 當 ω in A'
則 f 是 A-可測函數
∫_A f dP = P{EA}, ∫_A' f dP = P{EA'}, ∫_S f dP = P{E}
類似地,如果 {A_1, A_2, ...} 是 S 上一個分割,分割中各 A_n 都有正機率,G 是此分割產生的 σ-體,定義
f(ω) = P{E|A_n} 當 ω in A_n, n = 1, 2, ...
則
(1) f 是 G-可測;
(2) 對任意 G-可測集 B, ∫_B f dP = P{EB}。
上面的例子涉及的 F 的子 σ-體都是由樣本空間被分割為可數個各具正機率的事件所產生的,因此我們可以有 P{E|A_n} 的定義,藉以定義一 G-可測函數 f,結果 f 在 G 中一事件 B 的積分會是 EB 的機率。如果 G 中除空事件外還有機率 0 事件呢?例如連續型隨機變數 X 所產生的 σ-體,其相應的樣本空間分割組成是像
{ ω in S: X(ω) = x }
這樣的事件,其機率都是 0。因此,如前面由 P{E|A} 類的條件機率看 P{E|G} 是不夠的,我們必須有個方法,使條件機率的定義適用於任意隨機變數,或 F 的任意子 σ-體 G。於是我們把前述程序倒過來,並不由 P{E|A_n} 去定義 f(ω),而是直接要求 f(ω) 這函數要滿足:
(1) f 是 G-可測
(2) 對任意 G-可測集 B, ∫_B f dP = P{EB}
然後把符合上列條件的 f(ω) 函數定義為 P{E|G};當 G = σ(X) 時,P{E|σ(X)} 也寫成 P{E|X}。所以,P{E|X} 是定義在 S 的點函數。而在 [X = x] 這類事件有機率 0 出現時,P{E|X} 依上列條件並不能唯一定義,所以 P{E|X} 即使有機率之名和形,卻非真正的機率。
留言列表