機率和統計中常需耍由一個或多個隨機變數,經一個數學函數變換另一個或多個隨機變數,簡單的數學表示就是 Y = g(X)。並且,由 X 的分布可推導出 Y 的分布。這其中,有一個變換很特殊,在統計上也具有重要地位的數學變換,稱「分布函數變換」.
分布函數 (distribution function) 或稱「累積分布函數 (cumulated distribution function)」,通常昆跟隨機變數掛鉤的。以單一隨機變數,或更具體地說,實數值隨機變數,其定義是
F(x) = P[ X ≦ x ] (有的作者可能用 P[ X < x] 的定義,此處不採。)
這樣定義的分布函數是右連續 (right continuous) 的,數學表示法是 F(x+) = F(x)。圖形上就是在每個跳躍點下方空心(代表該點不存在)而上方實心(代表該點存在),以階梯型分布函數(離散型分布的分布函數)就是在每一個平台左端點實心而右端點空心(跳上一個台階了)。
所謂分布函數變換 Y = F(X) ,其中變換函數 F 就是 X 的分布函數。
如果一個分布函數 F 是處處嚴格遞增,也就是 x < y 保證 F(x) < F(y), 或者此分布的「支撑 (support)」是單一區間,而 F 在此區間內嚴格遞增,也就是除了 F(x) = 0 及 F(x) = 1 的區域以外嚴格遞增,那麼,分布函數變換將把任何這種分布轉成在 [0,1]] 的均勻分布。也就是說:
若 X~F, 則 Y = F(X) 具有在 [0,1] 的均勻分布。
設 X 的分布函數 F(x) 在支撑 [a,b] 是嚴格遞增的,也就是
F(a) = 0, F(b) = 1, 且在區間 [a,b] 是 x < y 則 F(x) < F(y)。
F(x) 是 X 的分布函數,則 Y = F(X) 在 [0,1] 服從均勻分布: P[ Y ≦ y ] = y 當 y 在 [0,1] 中。
對於上述嚴格遞增的 F 來說,這很容易由「變數轉換公式」證明,或直接用分布函數證明:
P[ Y ≦ y ] = P[ F(X) ≦ y ] = P[ X ≦ F^(-1)(y) ] = F(F^-1(y)) = y 當 0<y<1
其中關鍵是反函數 F^(-1) 的存在。
在離散型分布,其分布函數是階梯型的,不是一對一函數,當然不存在反函數。即使是連續型分布,如果 X 的分布支撑不是一個單一區間,則 F(x) 在中間會有一段平台,也不是一對一的,因此不存在反函數。這時,我們可以定義一個「虛擬反函數」G(p), 0 < p < 1,滿足 F(G(p)) = p, 則分布函數變換仍然把一個分布轉換成 [0,1] 間的均勻分布。