- Feb 08 Wed 2023 19:10
[舊文] 課堂上可能忽略的統計實務
- Feb 03 Fri 2023 10:56
我對貝氏方法的看法
我一直避談貝氏方法。事實上貝氏方法有兩種概念,它們導致相同決策,但解釋不同,而我個人想逃避的是所謂貝氏學派 (Bayesian) 的論點;但卻支持另一種很少人在談的觀點。
從決策的觀點,根據資料 x 做成決策 d(x),它在參數(或群體)值是 θ 時(本文中 θ 有時是參數的抽象代表,有時只是一點或一個值,有時又當成一個隨機變數,希望不會產生混淆)造成損失 L(d(x),θ)。假設 x 是從群體中隨機抽出,則對所有可能的 x 值做平均,也就是群體參數真值是 θ 時的期望損失為 R(d,θ), 對固定決策規則(決策函數) d 而言,R(d,θ) 是參數 θ 的函數,稱之為決策規則 d 的風險函數 (risk function)。要比較兩個決策規則的優劣,例如是用樣本平均數或中位數來估計一個群體的平均數,何者較佳,由於 θ 未知,必須比較兩個決策規則完整的風險函數。可是兩個風險函數 R(d',θ) 與 R(d",θ) 要比較並不容易,如果可以證實在每一 θ 點,某個決策規則的風險值都低於另一決策規則,例如 R(d',θ) ≦ R(d",θ) 對每一 θ 點都成立,並且在某些 θ 點是嚴格不等的,那麼表現一致較差的 d" 是不容許的 (inadmissible),當然要被淘汰。但是,很多時候決策規則是容許的 (admissible),也就是說可以證明不存在任何決策規則表現一致地較優,這樣的決策規則是否就沒問題?實際上「容許性」只是一個基本條件,符合容許性的決策規則也可能是毫無道理的,例如不看資料直接認定 θ = θ0 的決策規則,其風險函數在 θ0 處是最低的,沒有任何其他決策規則在此點的風險值比它低,甚至相等都難以做到。
當我們有許多不同決策規則可選時,完整風險函數的比較更顯複雜性。我們可能先去掉一些不具容許性的決策規則,然而這並不那麼容易,時常我們想證明一個特定決策規則都是很困難的。取而代之的,是把一個風險函數變成單一代表值,直接比較各決策規則的風險函數代表值,目標是選取一個風險代表值最小的決策規則。於是有兩個重要的方案:一是大中取小 (minimax) 準則,另一是平均風險或貝氏風險 (average or Bayes risk) 準則。大中取小準則就是以風險函數最大值
- Feb 01 Wed 2023 08:51
政府給民眾發現金好還是消費券好?
從個人角度來說,主觀上九成以上的人會支持發現金好吧?從實質經濟效益來說,幾乎是沒什麼差別,但現金使用較方便。從整體來說,最重要的是經濟效果,其次是行政作業。
顯然,從行政作業來看,發現金是比較簡單的;而發消費券(n 倍券)多了不少程序,多了產生行政疏失的可能,也多了循私舞弊的機會。
就總體經濟而言,民進黨政府早先為其發放 n 倍券辯護,是以 n 倍券能創造更多消費,發放現金民眾會存起來不消費為藉口;並且宣稱其 n 倍券比馬英九政府發消費券更有效。這完全是宣傳口號——從經濟學角度來看,發消費券(n 倍券)或發現金,都是政府移轉支出(國民移轉收入), 簡單說就是提升國民消費力。發消費券或 n 倍券,除了名稱不同,宣傳不同,有什麼能造成效益差別的?
- Jan 27 Fri 2023 16:15
垂直(距離)迴歸與 Deming 迴歸
普通最小平方迴歸的方法是固定 Xi 之下,使對應觀測值 Yi 與迴歸值 Yi' 之差距平方和最小,以簡單直線迴歸 Yi' = α + β Xi 為例,就是極小化
Q(α,β) = Σ(Yi - α - β Xi)^2
因此,若 Y 對 X 迴歸是 Y' = α + β X, 則 X 對 Y 迴歸並不是 X' = (1/β)Y - α/β, 因為後者要極小化的目標函數是 Σ(Xi-Xi')^2 而前者是 Σ(Yi-Yi')^2。但如果我們要求迴歸直線 y = α + β x 其係數 α, β 的選取準則是「資料點至迴歸直線的(垂直)距離平方和最小呢?
- Jan 25 Wed 2023 10:12
Stopping Time 與結果平衡問題
曾數次與人討論到生育控制與性別偏好對性別平衡的影響,昨日在 PTT BBS 看到一個投擲硬幣實驗的正反面平衡問題。我們把這問題抽象化,令 {Xn, n=1,2,...} 是一獨立 Bernoulli trials 過程,T 是一整數隨機變數,S = Σ_{n=1~T} Xn, 則我們期望 E[S/T] = P[X1=1]。此處隨機變數 T 稱為 stopping time(停止時間),是由停止規則 (stopping rule) 所決定出來的一個隨機時間,事件 [T = t] 只和 Xτ, τ≦t 有關。
機率論上所謂停止時間,也稱做馬可夫時間 (Markov time, Markov moment)、任選停止時間 (optional stopping time, optional time),其定義如下述:首先,在一機率空間 (Ω, A, P) 和一全序指標集 I(最常用的是 N 或 Z^+, R^+, 或 R^+ 的子集)上,我們建立一個篩選程序 (filtration) F = {Fi, i in I}, 其中 Fi 為 A 之一遞增子 σ-代數(σ-體),即 Fi, i in I 遞增且都是 A 的子集,且 Fi 都是 σ-代數,把 (Ω,A,F,P) 稱為一個過濾後的機率空間 (filtered probability space) 。而定義在機率空間上以 I 為值域的隨機變數 T 若滿足 [T≦t] 都是 Ft-可測,就稱 T 是一個停止時間。
就前述 Bernoulli 試作過程而言,Yn = Σ_{k=1~n} Xk/n 建立了一個新的隨機過程,而隨機變數 Y_T = Σ_{k=1~T} Xk/T 是此隨機過程結合停止時間 T 而成的隨機變數。不同的停止規則造成不同的停止時間,以生育控制問題為例,不同生育控制政策結合不同程度的性別偏好形成不同停止規則,也構建了不同的停止時間。以投擲硬幣實驗而言,也可有不同停止規則構建不同的停止時間隨機變數。
- Jan 10 Tue 2023 08:30
類對數級數:Σ_{n=1~N} a_n/Σ_{k≦n} a_k
設 {a_n, n=1,2,...} 是一個正數序列, S_n= Σ_{k=1~n}a_k, 問 Σ_{n=1~N} a_n/S_n 會是什麼模樣?
本文將此級數稱為「類對數」, 因為設 a_n ≡ 1, 則 S_n = n, Σ_{n=1~n} a_n/S_n ~ ㏒(S_n} = ㏒(n), 此處 ㏒ 為自然對數,符號 An~Bn 表示 lim An/Bn = 1。類比於連績型問題,a_n 類比正值函數 f(x),S_n-S_1 類比於 f(x) 在 [1,x] 的積分 F(x) = ∫_{1≦t≦x] f(t) dt,Σ_{n=1~N} a_n/S_n 類比於積分 ∫_{[1,N]} f(x)/F(x) dx = ㏒ F(N) - ㏒ F(1)。回到我們的問題,如果 a_n = n,則 S_n = n(n+1)/2,故
Σ_{n=1~N} a_n/S_n = Σ_{n=1~N} 2/(n+1) ~ 2(㏒(N+1) - ㏒2)~ ㏒(N(N+1)/2)
- Jan 02 Mon 2023 08:20
思考:統計是什麼?怎麼做?
統計的本質是什麼?是大量資料的分析。雖然小樣本方法被提出後,有三五個數字資料就想來個統計分析的屢見不鮮,但大量資料的分析似乎才是統計的本義。
大量資料怎麼看?類別資料單一分類大概只能看看資料所代表的個體是否集中在哪幾類,或關注有哪些稀有類別,從而歸納出一些結論。如果類別是有順序的,我們不免會看看個體在這些有序類別之間的分布是否有些特殊規律?如果有兩種或多種分類方式,我們可能考慮做交叉分類,看看個體的交叉分類分布是否呈現什麼規則?對於數值性資料,我們可以觀察其分布形狀,其集中趨勢或中心位置,也可以看其分布廣度,或看有沒有特殊的、遠離其他資料的資料點;也可以看看這些資料是不是可以看成是兩個以上的群體併在一起的。如果有分類變數將資料分群,或本來就是多組資料合併進行分析,可以比較這些次群體資料分布有沒有明顯差異,對有序分群的資料還可觀察次群體間的差異有沒有特定規律。主要數值資料之外還伴隨有相關變數的資料,可以觀察主變數與相關變數的散佈情形、關聯情形。
以上描述了一些「統計分析」所做的,歸納起來就是尋找資料中蘊藏的規律和變異,以及發現異常。規律是常,變異是變,但變也是常,沒有變異就不是統計資料了。規律又是平均,變異指的是正常存在的變化,是正常範圍。而「異常」就是例外,是「正常」狀態下不應出現的,如一群資料中出現極少數離群點,這些離群點是不應存在的,它們的存在想來必然有特殊原因。統計假說檢定就是一種評判資料是否異常的程序,這種程序是事先定了所謂的「正常」是什麼(H0),而評判資料是否異於這所謂的「正常」。不談涉及評判的統計假說檢定,只談所謂的規律或常,例如平均,移動或滾動平均,迴歸函數方法,這等於是資料的平滑。換句話說,統計從資料中尋找規律的方法,就是一種平滑化的方法。計算平均數、分位數等來描述資料,也是潛在假設資料是規律性的。資料的平滑化操作就是想把資料的規律描述、表現出來。
- Jan 01 Sun 2023 09:07
一個簡單的族群成長模型
有一個族群成長模型常用來描述一個群體,例如培養皿上的細菌數,的成長趨勢:
dN/dt = kN(1-N/M)
式中 N 表示群體的大小,是時間 t 的函數,M 代表環境限制,是 N 的上限,k 控制成長速度。由上式可知:N 的成長速率大抵是正比於群體大小的,這符合生物成長模式:較大群體衍生出更多新個體;但如果看相對成長速率,或成長率 (dN/dt)/N, 則餘裕空間 1-N/M 比例的大小限制了成長率,這看起來也是很合理的。這成長模型稱為「邏輯斯成長模型」;如果沒有「成長率受環境限制而減緩」的因素,模型 dN/dt = kN 就是一個指數成長模型。馬爾薩斯人口論就是認為人口數量的成長是指數成長,二十世紀後期則將人口成長視為邏輯斯成長,而今則有很多國家地區人口呈負成長現象。
- Dec 27 Tue 2022 09:00
疾病篩檢之準確度指標
準確度一詞其實是很籠統的名詞,在醫學上疾病篩檢更常用一些較明確的指標:敏感度 (sensitivity)、特異度 (specificity) 及其反面:偽陰性率 (false negative rate)、偽陽性率 (false positive rate)。
敏感度或稱靈敏度,在醫學檢驗或疾病篩檢指的是有病的人被檢驗結果是陽性的比例或機率,其反面是偽陰性率,也就是有病的人檢驗結果是陰性(暗指沒病)的比例或機率。特異度就是無病者檢驗結果是陰性的比例或機率,其反面是偽陽性率。通常醫院的疾病檢查會採用敏感度和特異度足夠高的方法,例如 COVID-19 的 PCR 檢驗,實驗室結果敏感度與特異度都接近 100%,不過,臨床(醫院實作)卻沒那麼好,敏感度可能只到 80%,但特異度倒是達到 98-99%。即使如此,PCR 仍是 COVID-19 最精準的檢測法,只是它需要專業的分析操作,費時也較久,從採樣到分析完成得出報告至少需要數個小時。另一方面,抗原快篩則是幾乎人人可操作並快速得到結果,且成本較低廉,適合廣泛使用。一般對大眾普遍篩檢某項疾病,都會採用與醫院檢驗不同,成本較低廉而準確度較差的檢測方法。
一個優良的醫學檢驗方法,敏感度與特異度都要足夠高。如果把有病無病比擬統計的未知參數或關於參數的假說,檢驗結果就是抽樣或實驗得到的資料,我們以檢驗結果判斷有無疾病或是否感染某種病毒,就像統計上根據樣本資料判定是否接受虛無假說或推估參數值。如果 H0 是有病或有感染病毒,則偽陰性率就是型Ⅰ誤機率,偽陽性率就是型Ⅱ誤機率,特異度就是檢定力;不過,也可能 H0 是無病或未感染病毒,那麼偽陰性率是型Ⅱ誤機率,偽陽性率是型Ⅰ誤機率,敏感度是檢定力。不管如何,在統計上型Ⅰ、Ⅱ誤機率我們都要儘量降低,正如在醫學檢驗或疾病篩檢問題我們希望偽陰性率、偽陽性率都能儘量降低。
- Dec 23 Fri 2022 09:28
試談由邊際分布建構聯合分布
設 F(x) 是一單變量機率分布函數,也就是說 F 是單調遞增、右連續(有些作者定義分布函數是左連續,差別是 F(x) 定義為 P[X≦x] 或 P[X<x])、F(-∞) = 0 且 F(∞) = 1。
今令 F*(x) = F(x)φ(x), 只要 φ 非降、非負、右連續且 φ(∞) = 1 而 φ(-∞) 有限, 則 F*(x) 也滿足一個機率分布的條件。反過來說,φ(x) = F*(x)/F(x), 其中 F* 與 F 都是機率分布函數,則 φ(x) 非負,右連續,且 φ(∞) = 1;但 φ 不一定單調,φ(-∞) 也不一定有限。不過,如果可能,除非有特定要求,想找一個函數 φ(x) 透過 F*(x) = F(x)φ(x) 由 F 建構 F*, 則選擇的 φ(x) 當然是找非降、非負、右連續且 φ(∞) = 1 而 φ(-∞) 有限。
如果是雙變量或多變量分布,右連續是針對每個變量的;單調遞增以雙變量為例就是對向變量的單調遞增再加上
- Dec 22 Thu 2022 15:08
單參數指數壽命估計問題
假設某物(例如電子零件)之壽命服從單參數指數分布
f(x) = (1/μ)e^(-x/μ), x > 0
則由 n 個 i.i.d. 觀測值組成的隨機樣本可得 μ 的 MLE 也是 UMVUE 為 μ^ = ΣXi/n。
- Dec 20 Tue 2022 17:17
趣味數學:蛋糕怎麼分才公平
有 n 個人分蛋糕,怎麼分才能人人覺得滿意?
這問題的基本假定是:其一,每個人都想分到最大塊的蛋糕;其二,每個人對蛋糕大小的評判是主觀(且固定)的;其三,每個人都可以精確切出任意他所要大小的蛋糕。
整個蛋糕,我們用一個宇集 S 表示;一塊蛋糕,用一個子集 A 表示,各人對蛋糕大小的評判,用測度 μi(A) 表示,並假設 μi(S) 都是 1。