聯集交集檢定 (Union-intersection test, UIT) 是對於一組 Hi 對 Ki 的假說檢定,成立一個綜合的假說檢定:

H: all of the Hi's are true,   K: some of the Ki's are true

如果 Hi 是 θ in Θ°i, Ki 是 θ in Θ'i,則

H: θ in ∩_i Θ°i,   K: θ in ∪_i Θ'i

若 Hi 對 Ki 之檢定的拒絕域是 x in Ci,則 H 對 K 的 UIT(UI 檢定)拒絕域為 x in ∪_i Ci。

類似地,交集聯集檢定 (intersection-union test, IUT) 是

H: some of the Hi's are true,   K: all of the Ki's are true

如果 Hi 是 θ in Θ°i, Ki 是 θ in Θ'i,則 IUT 為

H: θ in ∪_i Θ°i,   K: θ in ∩_i Θ'i

若 Hi 對 Ki 之檢定的拒絕域是 x in Ci,則 H 對 K 的 IUT 拒絕域為 x in ∩_i Ci。

在多重檢定或 ANOVA 的多重比較中,控制 FWER 也就是考慮 θ in ∩_i Θ°i 時 x in ∪_i Ci 的機率控制,這是 UIT 的例子。醫藥管理上的生體相等性檢定 (bioequivalence test) 考慮下列檢定(參見「怎樣「證明」虛無假說」一文):

H0: θ≦θ0-Δ 或 θ≧θ0+Δ      Ha: θ0-Δ<θ<θ0+Δ

實際的做法可能是做兩個單邊檢定問題:

H01: θ ≦ θ0-Δ        Ha1: θ > θ0-Δ
H02: θ ≧ θ0+Δ       Ha2: θ < θ0+Δ

也就是兩個檢定的 IUT。

假設諸 Hi 對 Ki 的檢定都採 α° 顯著水準,假設有 k 組個別檢定(Hi 對 Ki,i = 1,...,k), 則依 Bonferroni 不等式,UI 檢定的型Ⅰ誤機率不超過 kα°,IU 檢定的型Ⅰ誤機率則不超過 。但這樣的錯誤機率上限很難令人滿意。一個比較好的情況是 k 個檢定是相互獨立的情形,此時 UIT 的型Ⅰ誤機率是 1-(1-α°)^k。如果 α° 很小而 k 又不大,則其值可能接近上限 kα°,但通常諸個別檢定相互並不獨立。IU 檢定碰上個別檢定相互獨立的情形,在 ∩_i Θ°i 的型Ⅰ誤機率是 α°^k,在通常 α° 相當小的情形,IUT 的型Ⅰ誤機率極小,遠小於其上限 α°。不過如上面生體相等性檢定的例子,兩單邊對立假說的檢定當然是不獨立的,但真實的型Ⅰ誤機率當然也不等於甚至不靠近其上限 α°。

考慮一個特殊情形,諸個別檢定問題相似,其拒絕域都是 Ci = {x: Ti(x) > c}, 相同私臨界值 c,則 UIT 的拒絕域是

C = ∪_i Ci = {x: max_i Ti(x) > c}

如果 Ci = {x: Ti(x) < c} 則 C = {x: min_i Ti(x) < c}。如果個別檢定採用概度比檢定 (GLRT) 方法,

Ci = {x: λ_i(x) < c}, λ_i = max {f(x; θ): θ in Θ°i}/max{f(x; θ): θ in Θ}

分母是在全參數空間取概似度最大值,這是固定的;分子是在不同 Θ°i 之中取概似度最大,因不同 Θ°i 而不同。令

T(x) = min_i λ_i(x)

則如前述 UIT 的拒絕域是 C = {x: T(x) < c}。另一方面,如果H: θ in ∩_i Θ°i 對 K: θ in ∪_i Θ'i 的檢定問題也用概度比方法,其統計量為

λ(x) = max {f(x; θ): θ in ∩_i Θ°i}/max{f(x; θ): θ in Θ}

則 λ(x) ≦ λ_i(x) for all i, all x,因此,λ(x) ≦ T(x) 在每一 x 點成立,

{x: T(x) < c} included in {x: λ(x) < c}

也就是說,如果右邊是櫬度比檢定的拒絕域,左邊採用 T(x) 卻使用相冊臨界值 c,則 UIT 的拒絕域永遠包含於概度比檢定的拒絕域,故 GLRT 的橡定力函數 (power function) 值恆不低於 UIT 的橡定力函數,意即:

(1) GLRT 的型Ⅰ誤機率不低於 UIT,故若 GLRT 符合水準 α,則 UIT 亦然。

(2) 在相同臨界值的條件下,UIT 的檢定力低於 GLRT 或相等。

較高的型Ⅰ誤差機率當然可以有較高的檢定力,所以上列結論並不能說 UIT 比 GLRT 差,如果 UIT 的檢定大小 (test size),即型Ⅰ誤差機率最大值能控制得和 GLRT 一致,後者是否仍保有較高或至少相等的檢定力則未可知。另外,在某些特殊情形,UIT 可能就是 GLRT,例如,H: θ = θ° 對 K: θ ≠ θ° 的橡定可看成是 H_1: θ ≦ θ° 對 K_1: θ > θ° 和  H_1: θ ≧ θ° 對 K_1: θ < θ° 兩檢定問題的 UIT 問題,若兩單邊檢定問題採用 α/2 的 GLRT,其 UIT 可能就是雙邊問題的 α 水準 GLRT,至少在 θ 是常態群體平均數時是這樣的。

對於 IUT,由於拒絕域是個別檢定拒絕域的交集,因此當 θ 在 Θ° = ∪_i Θ°i 時,

P[x in C; θ] ≦P[x in Ci; θ]  ≦ α_i  當 θ in Θ°i

所以 IUT 的型Ⅰ誤機率不超過 max_i α_i,其中 α_i 為第 i 個檢定採用的顯著水準。但如前述,實際的型Ⅰ誤機率可能遠低於此水準。在 ∩_i Θ°i 中,型Ⅰ誤機率的上限是 min_i α_i,不過這可能沒有意義,因為現在 Θ° = ∪_i Θ°i 而不是 ∩_i Θ°i。對於 Θ° 中的 θ, 假設 θ 在某個 Θ°i 而不在其他 Θ°j,則

P[x in Ci ∩(∩_{j≠i}Cj); θ] ≦ min {P[x in Ci ; θ], min{P[x in Cj ; θ], j≠i}}

其中 P[x in Ci ; θ] ≦ α_i, 但 θ 不在 Θ°j, j≠i, 故 P[x in Cj ; θ] ,第 j 檢定的檢定力,不受控制,植端情形可能接近 1。若如此,則 IUT 的檢定大小可能可以達到上述顯著水準,即 max_i α_i。

如果 k 個個別檢定都採用 α° = α/k 水準做檢定,則 UIT 將

拒絕 H: θ in Θ° = ∩_i Θ°i  若且唯若 min_i p_i < α°

式中 p_i 為第 i 個檢定的 p-值,所以上列 UIT 的 p-值等於諸個別檢定 p-值中的最小值的 k 倍。而 IUT 則是

拒絕 H: θ in Θ° = ∪_i Θ°i  若且唯若 max_i p_i < α

故 IUT 的 p-值是諸 p-值之中的最大值。

 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 等死的老賊 的頭像
    等死的老賊

    劉應興的部落格

    等死的老賊 發表在 痞客邦 留言(0) 人氣()