曾數次與人討論到生育控制與性別偏好對性別平衡的影響,昨日在 PTT BBS 看到一個投擲硬幣實驗的正反面平衡問題。我們把這問題抽象化,令 {Xn, n=1,2,...} 是一獨立 Bernoulli trials 過程,T 是一整數隨機變數,S = Σ_{n=1~T} Xn, 則我們期望 E[S/T] = P[X1=1]。此處隨機變數 T 稱為 stopping time(停止時間),是由停止規則 (stopping rule) 所決定出來的一個隨機時間,事件 [T = t] 只和 Xτ, τ≦t 有關。
機率論上所謂停止時間,也稱做馬可夫時間 (Markov time, Markov moment)、任選停止時間 (optional stopping time, optional time),其定義如下述:首先,在一機率空間 (Ω, A, P) 和一全序指標集 I(最常用的是 N 或 Z^+, R^+, 或 R^+ 的子集)上,我們建立一個篩選程序 (filtration) F = {Fi, i in I}, 其中 Fi 為 A 之一遞增子 σ-代數(σ-體),即 Fi, i in I 遞增且都是 A 的子集,且 Fi 都是 σ-代數,把 (Ω,A,F,P) 稱為一個過濾後的機率空間 (filtered probability space) 。而定義在機率空間上以 I 為值域的隨機變數 T 若滿足 [T≦t] 都是 Ft-可測,就稱 T 是一個停止時間。
就前述 Bernoulli 試作過程而言,Yn = Σ_{k=1~n} Xk/n 建立了一個新的隨機過程,而隨機變數 Y_T = Σ_{k=1~T} Xk/T 是此隨機過程結合停止時間 T 而成的隨機變數。不同的停止規則造成不同的停止時間,以生育控制問題為例,不同生育控制政策結合不同程度的性別偏好形成不同停止規則,也構建了不同的停止時間。以投擲硬幣實驗而言,也可有不同停止規則構建不同的停止時間隨機變數。
由於 E[Xi] = E[X1], 對任意 i,因此
E[Yn] = Σ_{k=1~n} E[Xk]/n = E[X1]
恆成立。T 是一停止時間,因此在 T = n 條件下,
E[Y_T | T=n] = E[Yn] = E[X1]
也是恆成立,所以
E[Y_T] = E[E[Y_T | T]] = ΣP[T=n]E[Y_T|T=n] = E[X1]
這就是說:生育控制政策不影響出生性比。不過,出生性比與實際性比是不同的,如果因為性別偏好或其他因素引起棄嬰殺嬰事件,當然可能造成性別失衡。就投擲硬幣實驗來說,如果將投擲結果一一記錄無誤,結算實驗結果正反面總數,其比例將不違反原來出現正反面機率之比例;但若因期待某種結果而在記錄上有所偏頗遺漏,結果比例將會失衡。
如果 Xi 不是 Bernoulli 試作而是一般具有限期望值的 i.i.d. 隨機變數,Yn, Y_T 定義如前,T 是某停止規則定義出來的停止時間,則我們仍有
E[Y_T] = E[X1]
因為先前的演算只是期望值基本定律的應用,只需 Xi 期望值存在(有限)即可,因此上列結果完全沒有問題。
留言列表