機率和統計中常需耍由一個或多個隨機變數,經一個數學函數變換另一個或多個隨機變數,簡單的數學表示就是 Y = g(X)。並且,由 X 的分布可推導出 Y 的分布。這其中,有一個變換很特殊,在統計上也具有重要地位的數學變換,稱「分布函數變換」.

分布函數 (distribution function) 或稱「累積分布函數 (cumulated distribution function)」,通常昆跟隨機變數掛鉤的。以單一隨機變數,或更具體地說,實數值隨機變數,其定義是

  F(x) = P[ X ≦ x ]   (有的作者可能用 P[ X < x] 的定義,此處不採。)

這樣定義的分布函數是右連續 (right continuous) 的,數學表示法是 F(x+) = F(x)。圖形上就是在每個跳躍點下方空心(代表該點不存在)而上方實心(代表該點存在),以階梯型分布函數(離散型分布的分布函數)就是在每一個平台左端點實心而右端點空心(跳上一個台階了)。

所謂分布函數變換 Y = F(X) ,其中變換函數 F 就是 X 的分布函數。

如果一個分布函數 F 是處處嚴格遞增,也就是 x < y 保證 F(x) < F(y),  或者此分布的「支撑 (support)」是單一區間,而 F 在此區間內嚴格遞增,也就是除了 F(x) = 0 及 F(x) = 1 的區域以外嚴格遞增,那麼,分布函數變換將把任何這種分布轉成在 [0,1]] 的均勻分布。也就是說:

  若 X~F, 則 Y = F(X) 具有在 [0,1] 的均勻分布。

設 X 的分布函數 F(x) 在支撑 [a,b] 是嚴格遞增的,也就是

  F(a) = 0, F(b) = 1, 且在區間 [a,b] 是 x < y 則 F(x) < F(y)。

F(x) 是 X 的分布函數,則 Y = F(X) 在 [0,1] 服從均勻分布: P[ Y ≦ y ] = y 當 y 在 [0,1] 中。

對於上述嚴格遞增的 F 來說,這很容易由「變數轉換公式」證明,或直接用分布函數證明:

  P[ Y ≦ y ] = P[ F(X) ≦ y ] = P[ X ≦ F^(-1)(y) ] = F(F^-1(y)) = y 當 0<y<1

其中關鍵是反函數 F^(-1) 的存在。

在離散型分布,其分布函數是階梯型的,不是一對一函數,當然不存在反函數。即使是連續型分布,如果 X 的分布支撑不是一個單一區間,則 F(x) 在中間會有一段平台,也不是一對一的,因此不存在反函數。這時,我們可以定義一個「虛擬反函數」G(p), 0 < p < 1,滿足 F(G(p)) = p, 則分布函數變換仍然把一個分布轉換成 [0,1] 間的均勻分布。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 等死的老賊 的頭像
    等死的老賊

    劉應興的部落格

    等死的老賊 發表在 痞客邦 留言(0) 人氣()