群體變異數間差異之檢定

假設 Y(i1), ..., Y(in_i), i = 1, ..., k, 是相互獨立分別來自 N(μ_i, σ^2_i) 的樣本資料，也就是說分別自 k 個常態群體獨立抽取大小為 n_i 的隨機樣本，總樣本大小為 n = Σ n_i。我們關心 k 群體之變異數 σ^2_1, ..., ο^2_n 是否相等，

H0: σ^2_1 = . . . = σ^2_k = σ^2, Ha: some σ^2_i ≠ σ^2_j

概度比檢定 (likelihood ratio test) 統計量是

λ = {Π_i (s'^2_i)^{n_i/2}}/(s'^2)^{n/2}

式中 s'^2_i = Σ_j (Y(ij) - Y(i.))^2/n_i, s'^2 = Σ_i Σ_j (Y(ij) - Y(i.))^2/n，而其中 Y(i.) = Σ_j Y(ij)/n_i，即樣本 i 之樣本平均數。與一般「樣本變異數」相比，

s'^2_i = (n_i - 1) s^2_i/n_i, s'^2 = Σ_i (n_i - 1)s^2_i/n = (n-k)s^2/n

此處 s^2_i 是第 i 樣本變異數，s^2 是諸 s^2_i 以其自由度 n_1 - 1 加權的平均，即 H0 成立時共同 σ^2 的聯合不偏估計。拒絕域是 λ < λ*, 當 k = 2 時，相當於 F = s^2_1/s^2_2 偏高與偏低的部分。當 H0 成立時，前項 F 統計量服從 F(n_1-1, n_2-1)，也就是自由度 n_1 - 1, n_2 - 1 的 F 分布。這就是一般初級統計教程所謂的「兩群體變異比檢定」。

對於 k > 2, 概度比統計量一般取對數形式:

- 2 ㏑(λ) = n ㏑(s'^2) - Σ_i n_i ㏑(s'^2_i)

習慣上是取 s^2_i 代替 s'^2_i, 結果和上列 -2 ㏑(λ) 相差只是一個與諸 n_i 有關的常數項。Bartlett 檢定則是以

T = (n - k) ㏑(s^2) - Σ (n_i - 1)㏑(s^2_i)

為基礎，實際是採用

χ^2 = T/{1 + [Σ_i 1/(n_i - 1) - 1/(n-k)]/[3(k-1)]}

與自由度 k - 1 的卡方分布右尾臨界值比較。-2 ㏑(λ) 統計量在大樣本中常用卡方近似，其自由度依概度比大樣本理論是 k - 1；而 Bartlett 檢定是修正自前項概度比轉換的 -2 ㏑(λ)，使更近似 χ^2(k-1)，原始論文為 Bartlett, M. S. (1937). "Properties of sufficiency and statistical tests". Proceedings of the Royal Statistical Society, Series A 160, 268–282.

如同兩群體變異比之 F 檢定，Bartlett 檢定對群體的非常態性很敏感，一方面是群體非常態則型Ⅰ誤機率可能遠大於名目顯著水準；另方面是如果檢定結果呈現顯著差異，可能只是因為群體非常態，而不是諸群體之變異數不等。取而代之的，Levene 檢定或 Brown-Forsythe 檢定是對群體非常態性較不敏慼的檢定方法。這兩種檢定很相似，都是把原資料轉換成離中（均）差絕對值

(Levene) Z(ij) = |Y(ij) - Y(i.)|; (B-F) Z(ij) = |Y(ij) - Y*(i,.)|

式中 Y(i.) 如前述是第 i 樣本平均數，而 Y*(i,.) 是第 i 樣本中位數，或某個比例的截尾平均數 (trimmed mean，或譯：裁剪、修剪、截斷平均數) 。然後對上列轉換後資料做變異數分析，用 F 檢定。兩者何者較適當與群體真實分布有關， Brown and Forsythe (1974) 的蒙地卡羅模擬發現高狹峰（厚尾）分布群體如 Cauchy 分布，以截尾平均取代簡單樣本平均或中位數為計算離差的中心最佳；而高度偏斜如 4 個自由度的卡方分布群體，則是樣本中位數較佳；而原始的 Levene 檢定則適用於群體分布比較對稱，峰度也不太高，也就是尾巴比較普通的情形。

有個問題是 Z(ij) 並不符合 ANOVA 的各項假設，以 Levene 檢定為例，諸離均差 Zij, j = 1, ..., n_i, i = 1, ..., k, 非常態分布固不用說，相同 i 之下各 Z(ij) 相互並不獨立，不同 i 之間諸 Z(ij) 也不是等幅變異。非常態性的問題，由於 ANOVA 的 F 檢定是兩獨立樣本 t 檢定的多群體（多樣本）版本，如 t 檢定一般具有穩健性 (robustness)，也就是說對非常態性不那麼敏感。由於 Y(ij), Z(ij) 是半常態分布，即常態分布從中心折半，故尾巴不會太厚（峰度不太高；雖有偏態，其偏態系數也就相當於 8 或 9 自由度的卡方分布。這意謂因取絕對值導致的非常態性在 ANOVA 產生的問題不大。

假設 Y(ij) 是常態分布，則

D(ij) ≡ Y(ij) - Y(i.) ～ N(0, (1-1/n_i)σ^2_i)

諸 D(ij) 聯合服從多變量常態分布，且

Cov(D(ij), D(ij')) = (δ(jj') - 1/n_i)σ^2_i

其中 δ(jj') = 1 當 j = j'; 否則為 0。因此，

E[Z(ij)] = E[|D(ij)|] = √[(2/π)(1-1/n_i)σ^2_i]
Var[Z(ij)] = E[D(ij)^2] - (E[|D(ij)|])^2 = (1-2/π)(1-1/n_i)σ^2_i

上列兩式表示：

(1) 原本 Y(ij) 代表的 k 個群體間變異數相等與否的問題，幾乎轉換成 Z(ij) 所代表的群體之間平均數相等與否的問題。之所以只是「幾乎」而不是完全轉換，因為其中有 n_i 的作用，當各樣本大小 n_i 一致，或樣本均不小時，n_i 之差異造成的作用可以忽略，那麼 Z(ij) 之組間平均數差異，就代表了 Y(ij) 組間變異數的差異。

(2) 虛無假說不成立時，Z(ij) 所代表的群體之間變異數也是不等的。但檢定方法所依賴的是虛無分布，也就是虛無假說成立時檢定統計量的分布，而此時除各組樣本大小差異造成的影響外，變異數可以說是同幅的。

很明顯 Z(ij) 與 Z(ij') 不獨立，因為它們有共同的 Y(i.)；實際上可以證明 E[Z(ij)Z(ij')] ≠ E[Z(ij)]E[Z(ij')], j≠j'，不過其計算及結果太瑣碎，就不列了。注意 Z(ij) = |D(ij)|，而 Σ_j D(ij) = 0 for all i，若 n_i = 2, 則 Z(i1) = Z(i2); 但 n_i > 2 時並不能構成 Z(i1), ..., Z(in_i) 間的函數限制式，也就是說，由於取了絕對值，使得 Z(ij) 之間沒有了 D(ij) 間的線性相依現象，甚至也不存在完全函數關係。

在「線性模型：當誤差非等幅變異時」一文中，我們談到普通最小平方法和加權或一般最小平方法結果一致的條件

V = XΓX' + ZΘZ' + λI

其中 c(X) 和 c(Z) 正交。對 Z(ij) 做一因子變異數分析的問題，全模型的模型矩陣是

X = Blk Diag(J_1, . . ., J_k]

其中 J_i 是長度 n_i 元素值皆為 1 的行向量。而觀測值向量 Z = [ Z(ij) ] 的共變異矩陣正是

V = BlkDiag(V_1, . . ., V_k)
= BlkDiag((1-ρ_1) I_1 + ρ_1 J_1 J'_1, . . ., (1-ρ_k) I_k + ρ_k J_k J'_k)
= X Diag(τ_1, ..., τ_k) X' + BlkDiag(λ_1 I_1, . . ., λ_k I_k)

的形式，其中 I_i 是階為 n_i 的單位矩陣。對此模型而言，各區塊之估計並不相干，也就是說

A = BlkDiak(A_1, . . ., A_k),

其中 A_i = J_i J'_i V_i^{-1}/J'_i V_i^{-1} J_i。但因

V_i = τ_i J_i J'_i + λ_i I_i

因此普通最小平方法得到的是 BLUE。在縮減模型，也就是假設虛無假說成立，對應的模型矩陣是 J，一個元素皆為 1 的 n×1 矩陣或行向量，c(J) 上的垂直投影是 M* = JJ'/n。將 X 分解為

X = U + W, 其中 U = M* X, W = (I - M*)X

則 U = M* X = J(J'X/n)

V = τ XX' + λ I = τ JΓJ' + τ WW' + λ I

其中 Γ = J'XX'J/n^2。故，普通最小平方法估計仍是 BLUE。當然如先前說過，可能 n_i 的不等會導致實際上即使 H0 成立仍存在 Z(ij) 對應的群體變異數（及平均數）略有差異，在此假設這個問題可以忽略。

在一般最小平方法的 ANOVA 中，檢定統計量是

F = [Y'(A-A*)'V^{-1}(A-A*)Y/(k-1)]／[Y'(I-A)'V^{-1}(I-A)Y/(n-k)]

其中 A 是在 c(X) 之投影而 A* 是在 c(J) 之斜交投影。此處因在全模型 (E[Z] in c(X) = c(A)) 與縮減模型 (E[Z] in c(J) = c(A*)) 中 Cov(Z) 不同，V 該對用哪個？由於決定拒絕 H0 與否是根據 H0 成立時的分布，因此

V = τ XX' + λ I; 所以 V^{-1} = α I + β XX'

而 AY = MY 且 A*Y= M*Y，結果

F = [Y'(M-M*)V^{-1}(M-M*)Y/(k-1)]／[Y'(I-M)V^{-1}(I-M)Y/(n-k)]
= [Y'(M-M*)Y/(k-1)]／[Y'(I-M)Y/(n-k)]

總結來說，除了 Z(ij) 非常態性問題以外，普通 ANOVA 方法檢定組間平均數差異是適當的（條件是 n_i 都大於 2 並且 n_i 間差異不大，或 n_i 都夠大）。

當原資料 Y(ij) 是常態時，資料 Z(ij) 符合

Var(Z(ij)) = c(E[Z(ij)])^2

如前述，用變異數穩定化變換 (variance-stabilizing transformation) 可將資料轉換成

X(ij) = ㏒(Z(ij))

則 Z(ij) 之組間差異在 X(ij) 仍保持相同順序，但 X(ij) 將可望縮小組間變異數差距。當 Y(ij) 非常態時，Z(ij) 的資料變換及 ANOVA 的實施，基本上是認為 E[Z(ij)] 與 Var(Y(ij))，或更精確地說是與 √Var(Y(ij)) 成正向關聯，因此 Var(Z(ij)) 與 (E[Z(ij)])^2 的比例關係似可預期。換言之，前述定義的 Z(ij) 或許再取個對數變換，然後進行普通一因子變異數分析，或許更合適？不過，從 F 統計量來看，問題主要還是在於 Z(ij) 同組內的相關，而且這項相關即使對 Z(ij) 做了對數變換，其相關仍存在，但正如前面對 Z(ij) 做 ANOVA 時的討論，此項相關基本上不影響 ANOVA 的採行。

還有其他方法，例如 Jackknife 方法：

u(ij) = n_i ㏒(s^2_i) - (n_i - 1) ㏒(s^2_i(-j))

其中 s^2_i(-j) 是剔除 i 樣本中第 j 觀測值之後計算的第 i 樣本變異數，而 s^2_i 則是第 i 樣本之全樣本變異數。也是對 u(ij) 進行一因子變異數分析。

等死的老賊

劉應興的部落格

等死的老賊發表在痞客邦留言(0) 人氣(9)

劉應興的部落格

歡迎光臨劉應興在痞客邦的小天地由側欄的文章分類可以知道這個部落格的主題。