信賴區間 (Confidence interval) , 或對應在貝氏分析中應的「可信區間 (credible interval)」,是關於一個實數值參數值落在什麼範圍的一個描述。例如說:

在 1-α 信賴水準下,民眾在 XXX 意見上表示支持的比例在 xx% 至 yy% 之間。

預測區間 (Prediction ynterval) 是於群髒未明(如:有未知其值的參數存在)之下一個實數值隨機變數可能實現在什麼範圍的一個綜合性描述,例如:

在 1-α 信賴水準下,隨機抽選 10 個民眾在 XXX 意見上表示支持的比例在 xx% 至 yy% 之間。

這裡問「隨機抽選 10 個民眾」的支持率只是一個舉例,因假設一個人的回答只有「0 =不支持」或「1=支持」兩種可能之一,觀察多人的回答才能得出有意義的支持率。如果群體特性是很明確的,在此也就是說群體的「支持率」是已知的,上列「在 xx% 至 yy% 之間」並不涉及抽樣,是固定而且明確的區間,1-α 是「隨機抽選 10 個人問其在 XXX 意見上是否支持,至少有 100(1-α)% 的結果支持比例是落在 xx% 至 yy% 之間。此時「xx% 至 yy% 之間」這個預測區間究竟包含那 10 位民眾表示支持的比例 (0/10~10/10) 多少可能性。在上列陳述中並未表明。容忍區間 (tolerance Interval, 或譯「容受區間」較合適?) 又是另一種情況:在每一組大小為 n 的樣本被觀測後,我們建立一個區間「xx% 至 yy% 之間」,群體參數 p (支持率) 的不同值使得 10 位民眾的支持率落在此區間的機率各有不同,而如果前項區間是「(1-α)信賴水準/p機率」的容忍區間,其陳述是

在 1-α 信賴水準下,隨機抽選 10 個民眾在 XXX 意見上表示支持的比例在 xx% 至 yy% 之間的機率至少為 p。

對群髒參數的任意特定值,乞如此處「支持率」等於某特定值時,不難取特定預測區間「在 xx% 至 yy% 之間」使預測正確(10 人私支持率落在區間內)的機率至少為 p;但問題是我們不知群體參數的值,因此只能根據隨機樣本的結果決定「在 xx% 至 yy% 之間」。對於這樣的區間,「預測區間」的做法是不管所建立該區間正班預測的機率,而是考慮重複抽樣、建構預測區間這程序的正確預測率至少 1-α,即受信賴水準控制。而「容屍區間」其實也是一種預測用途的區間,但它希望此「在 xx% 至 yy% 之間」至少有 p 的正確預測機率。只是群體參數正確值未知,而區間「在 xx% 至 yy% 之間」又是根據隨機樣本結果建構的,因此該區間可能有 p 以上正確預測機率,也可能不及, 1-α 水準的機率 p 容忍區間,就是在重複抽樣-建構區間的程序中,至少 1-α 比例的區間有至少 p 的正確預測機率。

如果要預測一個常態變量 X~N(μ, σ^2),自 X 群體隨機抽取 X1, ..., Xn 為樣本,得樣本平均數 Y = y,樣本標準差 S = s。點預測為樣本平均數,用於預測 X 其均方誤差

Var(X-Y) = (1+1/n)σ^2

通常用 t 區間做為「預測區間」

[L(x), U(x)] = [y - t* s √(1+1/n), y + t* s √(1+1/n)]

其中 x 為樣本觀測值整體,t* 為自由度 n-1 之 t 分布右尾 α/2 機率臨界值,這樣的預測區間信賴係數為 1-α。此區間預測正確機率

P[ X in [L(x), U(x)]; μ, σ^2]
     = Φ((y-μ)/σ + t* √(1+1/n) s/σ) - Φ((y-μ)/σ - t* √(1+1/n) s/σ)

式中 Φ(.) 為標準常態分布函數。做為容忍區間,容忍上下限 U(x) 與 L(x) 改用 y ± t s,則

P[ X in [L(x), U(x)]; μ, σ^2] = Φ((y-μ)/σ + t s/σ) - Φ((y-μ)/σ - t s/σ)

其中 t 只是一個適當乘數。如果 t = t* √(1+1/n) 就與先前的「預測區間」一致了。但在考慮容忍區間時,我們希望

 Φ((y-μ)/σ + t s/σ) - Φ((y-μ)/σ - t s/σ) ≧ p

只是這不一定能成立,我們只希望有 1-α 以上的信賴水準讓我們相信上列不等式「應該是對的」。什麼叫「在 1-α 的信賴水準下此機率不等式是對的」?意思就是要求

P[Φ((Y-μ)/σ + t S/σ) - Φ((Y-μ)/σ - t S/σ) ≧ p; μ, σ^2] ≧ 1-α

對所有 (μ, σ^2) 參數值都成立。式中 Y 與 S 相互獨立9,(Y-μ)/σ 服從 N(0, 1/n),而 S/σ~~√(χ^2/ν),其中 ν = n-1 是 χ^2 變量的自由度。因此,上列覆蓋機率完全與參數 (μ, σ^2) 無關。換言之,在樣本數 n 固定之下,上式左邊以 ψ(t,p) 表之,是 t 和 p 的函數,而且 p 固定時它是 t 的嚴格增函數,t 固定時則是 p 的嚴格減函數。由於涉及的分布是連續型, ψ(t,p) = 1 - α 對任意 (0, 1) 之間的 α 是可達到的,也就是說給予信賴水準 1 - α 和區間含蓋率 p 的要求給定,則可計算出唯一 t 值,使如上述定義的容忍區間 [L(x), U(x)] 含蓋率至少為 p 的信賴水準達 1 - α。只是,並無公式可解 t 值,而需要數值計算。

對於非常態群體,如果是連續型分布的群體,可以改用順序統計量 [Y(k), Y(h)] 取代 t 區間。如果群體分布函數是 F(.),則一個「(1-α)信賴水準/p機率」的容忍區間 [Y(k), Y(h)] 滿足條件

P[F(Y(h)) - F(Y(k)) ≧ p] ≧ 1 - α, for all F

式中 Y(1) ≦ … ≦ Y(k) < Y(h) ≦ … ≦ Y(n) 是樣本 X 的順序統計量。因 X~F 則 F(X) 是 U(0,1) 變量,所以 F(Y(i)), i = 1, ..., n 是從 U(0, 1) 群體抽出之大小為 n 的隨機樣本的順序統計量,F(Y(k)), F(Y(h)) 的聯合 p.d.f.  h(u(k), u(h)) 為:當 0 < u(k) < u(h) < 1 時其值

 [n!/((k-1)!(h-k-1)!(n-h)!)] (u(k))^(k-1) (u(h)-u(k))^(h-k-1) (1-u(h))^(n-h)

其他處 0。則對任意 n, k, h 及 p, 可計算

γ = P[F(Y(h)) - F(Y(k)) ≧ p]
   = ∫_[0,1-p] ∫_[u+p,1] h(u,v) dv du
   = ∫_[0,1-p] ∫_[u+p,1] c(n,k,h) (u(k))u^(k-1) (v-u)^(h-k-1) (1-v)^(n-h) dv du

式中 c(n,k,h) = n!/((k-1)!(h-k-1)!(n-h)!)。固定 n, h, k 則 γ 是 p 的遞減函數,因此在 p 給定,要求 γ ≧ 1-α 則需適當調整 n, k, h 三者。若 k = 1, h = n, 則

γ = 1 -p^n - n(1-p)p^(n-1)

初步近似,需要 n ≧ 1 + √(1-α)/(1-p), 信賴水準 1-α 愈高,或區間含蓋率 p 愈高,都要求愈大的樣本數。也就是說,樣本數太小,將不能保證有足夠信賴水準及夠高的含蓋率的容忍區間。另一方面,如果 n 足夠大,容忍區間並不需要以最小和最大順序統計量構建,而可以用其他個順序統計量,[Y(k), Y(h)] 構造出所要的容忍區間。

一般而言,由預測區間 [L(x), U(x)],我們可以計算機率 γ(x) = P[ X in [L(x), U(x)]],而容忍區間是需要

P[  γ(X) ≧ p ] ≧ 1 - α  for all population distributions F 

預測區間 [L(x), U(x)] 的構建方式含有某些政策數如前面常態群體例子的 t 又先前順序統計量的 k, h,而要建構容忍區間使滿足信賴水準 1-α 與含蓋率 p 的要求,可藉由調整前述政策變數達到,或者可能有最小樣本數的要求。不過,如前述兩個例子,其政策變數值的確定可能沒有簡單公式,需要繁複的數值計算或搜尋程序。

文章標籤
全站熱搜
創作者介紹
創作者 等死的老賊 的頭像
等死的老賊

劉應興的部落格

等死的老賊 發表在 痞客邦 留言(2) 人氣(14)