機率論中,樣本空間是一個隨機實驗所有可能結果所形成的集合,隨機變數是從樣本空間映至實數線或複數平面的函數;隨機向量可以看成是多個隨機變數組成的向量,也可以說是定義在樣本空間的一個向量值函數;同樣我們可以在樣本空間定義矩陣值函數,那就是隨機矩陣。一堆隨機變數組合成一個整體,有時也稱隨機過程 (random or stochastic process),有時稱隨機場 (random field)。
通常這一堆隨機變數用一個實數或整數值註標組成的稱之為隨機過程,而隨機場可以是隨機過程,也可以是有兩個以上的註標,這些註標所在範圍通常是 R^k,但也可以是其他域 (domain) 如某個流形 (manifold)。甚至,除了實數值隨機變數、複數值隨機變數、向量值隨機變數(即:隨機向量),我們可考慮張量值隨機變數、函數值隨機變數或隨機函數。那麼,隨機過程和隨機場裡每個成員隨機變數除了實數值或複數值以外,也可以是向量值、張量值、或函數值。
這看起來很複雜,其實複數值隨機變數 Z 只不過是兩個實數值隨機變數 X, Y 湊成一對,把它當成複數看待罷了;向量值隨機變數不過是有限或無限個實數值或複數值隨機變數湊在一起構成一個向量 (X1,...,Xn) 而已。函數值隨機變數 W(t) 對應每個 t 它就是一個實數、複數或向量值隨機變數。如果我們考慮一個向量值隨機過程:{ Vt; t in T}, 就是說針對每個 t,有一個隨機向量 Vt = (X1t,...,Xnt), 這可以看成一個兩註標的隨機場,可以看成同時有 n 個隨機過程,也可以看成是一個 n 維的函數值隨機向量 (X1(t),...,Xn(t)), 每個分量 Xi(t) 是一個隨機函數。所以,最基礎的是實數值隨機變數,或者再加一個複數值。而向量值、張量值、函數值,隨機向量、隨機過程、隨機場等,都只是為了應用方便的不同組合,不同稱呼罷了。
樣本空間是隨機實驗所有可能結果所形成的集合,隨機變數是定義在這集合上的函數。暫且不管隨機變數定義上需耍滿足什麼條件,當我們考慮一大堆隨機變數時,對應的樣本空間是什麼樣子的?首先我們得有一個基本概念:除特殊情況,在一個問題中不管有多少隨機變數,我們面對的只有一個樣本空間,也就是只考慮一個隨機實驗。但是,所謂「一個」隨機實驗,並不是「一次」實驗操作。例如,考慮一個 Bernoulli process, 它所對應的實際實驗操作可能是一連串無窮次的丟銅板操作;考慮一個 Poisson process, 其樣本空間可能是 Ω = {0,1}^(0,∞), 即所有定義在 (0,∞) 映至 {0,1} 的函數。後一實例相當於在半數線 (0,∞) 上每一點有一個 Bernoulli trial, 而所有 Bernoulli trials 相互都是隨機獨立的。隨機變數 N(t) 即在 (0,t] 上經歷的 Bernoulli trials 有多少次結果是 1, 或以 Bernoulli trial 的說法是有多少次「成功」。所以,樣本空間的樣本點,本身可能是一個向量,一個無窮數列,甚至是一個函數。
隨機變數是樣本空間 Ω 映至 R 的一個函數。機率論上「事件」是 Ω 的子集,但在較高等課程中會說到:並不是樣本空間的任意子集都可以稱之為事件,但 Ω 中所有可稱之為事件的子集必須形成一個系統,它使得我們在事件上指定機率不會產生矛盾。這其中首先是:做為指定事件機率的規則,或稱機率函數,或機率分布,P,它要符合什麼規則?也就是機率的三大公設:
1) 非負性: 事件的機率都是非負值;
2) 歸一化: P(Ω) = 1;
3) 可加性: 任意兩兩互斥事件序列, 其聯集機率是個別事件機率的和。
由於在事件上指定機率必須滿足上列公設,所以 Ω 上可稱為「事件」的必須滿足:
1) Ω 是一個事件;
2) 若 E1, E2, ... 是兩兩互斥的事件序列,則其聯集也是一個事件。
假設 E 是一個事件,則其補集 E' 也應是一個事件,P(E)+P(E') = P(Ω) = 1; 如果 E, F 都是事件,其交集 EF 及差集 EF' = E - F 也必須是個事件。因此,Ω 上所有事件的總體(所有事件形成的集合)F 滿足:
1) Ω 在 F 中;
2) E 在 F 中則 E' 在 F 中;
3) E1, E2, ... 在 F 中則 ∪Fn 在 F 中。
這樣的 Ω 的子集合族 F 被稱為 Ω 的一個σ-體或 σ-場 (σ-field),或 σ-代數 (σ-algebra)。若 Ω 是一個拓樸空間 (topological space), 如 R 搭配一般的開集合定義,則由 Ω 的所有開集合產生的 σ-體,即包含所有開集合的最小 σ-體,稱為 Borel 體,其中的元素(都是 Ω 的子集)稱為 Borel 集。我們特別有興趣的是 R 上的 Borel 集;當然對 C 上,對 R^n 上的 Borel 集也有興趣,它們都可以由 R 上的 Borel 體定義。
在較高級機率論課程中,給予(實數值)隨機變數較完整的定義:
(實數值)隨機變數是定義在樣本空間上的幾乎實數值可測函數。
隨機變數雖然號稱實數值,其實其對應域 (codomain) 還包括兩個非實數元素,+∞ 與 -∞。「幾乎實數值」意謂
P[X=±∞] = P{ω in Ω: X(ω) = ±∞} = 0
也就是 P[X in R] = 1。可測 (measurable) 意謂 R^* = R∪{-∞,+∞} 上的任意 Borel 集之 X-前像 (preimage) 都是 Ω 上的可測集(即 Ω 上之原設 σ-體F的元素)。所以隨機變數 X 其實涉及整個機率空間 (Ω,F,P),所以有時我們稱隨機變數是定義在一個機率空間上,雖然其定義域實際上也就樣本空間 Ω 而已。
實務上我們總是關心隨機變數的機率分布,但其實根本是在機率空間。機率空間是和隨機實驗緊密相連的,因為定義上樣本空間就是隨機實驗所有可能結果的集合,機率函數(機率分布)也是依隨機實驗的特性而定值。例如有限群體不放還法抽樣,如抽撲克牌,根據抽樣的機制可以得出各可能結果或事件的機率。如撲克牌梭哈遊戲,可以知道抽出5張有恰巧一對的機率為
C(13,1)C(12,3)C(4,2)(C(4,1))^3/C(52,5)
在這個隨機實驗,52張牌任取5張,可能的結果共有 C(52,5) 種,也就是說樣本空間 Ω 有那麼多個元素,而且每個元素構成的簡單事件有相同機率 1/C(52,5);總共有 2^C(52,5) 個不同事件,其中含空事件 φ, 全事件 Ω, C(52,5) 個簡單事件。現在如果定義一個隨機變數 X 代表抽出紙牌的總點數(花牌可以依 11, 12, 13 計點,或以 10 計點,或以 0.5 計點,依遊戲總類而定),則 X 等於某個特定值或 X 在某個範圍都可以對應到原機率空間的某個事件,從而得以計算其機率。
就一般情況來說,我們關心隨機變數 X 落在某範圍的機率 P[X in B], B 是 R* 上的一個 Borel 集。我們習慣了 [X in B] 這樣的事件,習慣了用 X 的分布來看機率問題。但是,[X in B] 這個事件其實是
[X in B] = {ω in Ω; X(ω) in B}
記住這一點在某些問題如隨機變數是否獨立是重要的。隨機變數 X, Y 相互獨立,或機率獨立,或稱隨機獨立,是指
P[X in A, Y in B] = P[X in A]P[Y in B] for all Borel sets A, B
如果就 X, Y 的值域或對應域來說,是不同空間,如何談獨立或不獨立?兩事件獨立很簡單,定義就是交集的機率等於個別機率相乘:
P(A∩B) = P(A)P(B)
把前面兩隨機變數獨立的定義改寫一下:
P({ω in Ω; X(ω) in A}∩{ω in Ω; Y(ω) in B})
= P{ω in Ω; X(ω) in A}P{ω in Ω; Y(ω) in B}
for all Borel sets A, B
這只是把先前的定義寫清楚,明示我們考慮的機率是樣本空間 Ω 上的兩個事件族的機率問題:一個事件族是和 X 有關的,或說是由 X 所定義的,習慣上用 σ(X) 表示這樣的事件族;另一個事件族是由 Y 所定義的,σ(Y)。也就是說:隨機變數 X 與 Y 相互獨立,就是事件族 σ(X) 與 σ(Y) 獨立;也就是從 σ(X) 任選一事件 E, 從 σ(Y) 任取一事件 F, 兩事件都相互獨立,這就是 X 與 Y 相互獨立。注意 σ(X) 與 σ(Y) 都只是原始機率空間 σ-體F的一個子集。
現在如果有兩個 Borel 函數 f, g, 定義了兩個新隨機變數 U = f(X) 即 f 與 X 的合成, V = g(Y) 是 g 與 Y 的合成,那麼 σ(U) 將是 σ(X) 的子集,也就是在 σ(U) 的事件也都在 σ(X) 中;σ(V) 是 σ(Y) 的子集。既然 σ(X) 與 σ(Y) 相互獨立,根據事件族獨立的定義,當然 σ(U) 與 σ(V) 也獨立,也就是說 U 與 V 也獨立。這結果很容易擴展至多隨機向量的問題,例如:若 X = (X1,...,Xm), Y = (Y1,...,Yn), Z = (Z1,...,Zp) 是相互獨立的隨機向量,f, g, h 是三個多變量向量或純量值 Borel 函數,U = f(X), V = g(Y), W = h(Z), 則隨機向量或隨機變數 U, V, W 也相互獨立。
留言列表