目前分類:統計想法與議論 (9)

瀏覽方式: 標題列表 簡短摘要

去年筆者遮「點估計的方法」即提到估計方法中兩類重要的方法,一是資料配適 (data fitting, 按:fitting 目前多譯為「校估」,筆者先入為主偏愛「配適」),一為誤差評量。今年年初,「思考:統計是什麼?怎麼做?」闡釋統計無非是在「資料」」與「假設模型」之間取一「估計模型」。年中「樣本分位數的大樣本漸近分布」一文以中位數迴歸模型例示在 data fitting 準則下,計算不同群體模型之下的誤差評量。本文要再對資料配適與誤差評量做一說明。

假設資料是 Y1, . . ., Y_n,或許有配對的輔助資料 X_1, . . ., X_n 如迴歸模型,或時間順序 t = 1, ..., n 如時間序列。而假設的模型或參數可以簡單地用 θ 表示,而這裡則要反映到與「資料」相組配;同時,配適或估計的模型或參數 θ^ 也可以反映到資料上。因此,我們有:

觀測的樣本資料:   Y_1,     . . . ,  Y_n

等死的老賊 發表在 痞客邦 留言(0) 人氣()

在數理統計中,常見「最佳」的要求或討論,如最佳不偏估計(一致最小變異不偏估計),最佳線性不偏估計,最佳檢定(一致最強力檢定),最佳不偏檢定。頻率論方法希望找到在某一損失函數下風險函數整個達到最低值的決策規則,因不可能,故而只在符合某種條件的決策規則中尋找;再退而求其次,採用競賽理論中的觀念,大中取小,極小化最大風險。貝氏學派的方法較簡易,不承認隨機樣本資料的隨機性,反而認為那看不見理不清的群體才應該視之為隨機,並堅信可以用一個機率分布描述它,於是很簡單的只要找基於設定的,描述群體隨機性的機率分布(先驗分布),期望(後驗)損失最小的決策就好了。因為不考慮因隨機抽樣或實驗中可能出現而未出現的資料,不需考慮具體抽樣架構;因為那看不清的群體的不確定性被確定的先驗分布給描述、給平均了,「決策」只是單一決策而不需論及它的函數意義,因為根據給予的先驗分布把所有可能的群體做了平均彙總,期望損失只是單一數值。

但是,學到現在我們發現:所謂「最佳」都不是真的。線性模型的最佳線性檢定只是因為採用平方誤差損失,如果不是平方誤差損失,它還是最佳嗎?更別說不偏的要求和限制估計量為觀測值的線性組合,也只因為是線性模型而合理。一致最小變異不偏估計同樣是平方誤差損失的結果,更因不偏性的要求排除了大量的估計量,甚至因許多問題不存在不偏估計量,而被學者所詬病,把以前被認為是估計量一個優良與否的判準,反當做是無必要的限制。檢定方法的判準,除貝氏學派外大抵還依循 Neyman-Pearson 控制型Ⅰ誤機率而後極小化型Ⅱ誤機率的套路,但決策理論也試圖用損失函數來處理,那麼不同損失函數之下「最佳」結果的不同將再次出現。從頻率論來看決策理論,無限制的一致最佳是不可能達到的,因此對決策函數做限制,如某種不偏性的要求、特殊架構之下的不變性或等變性要求是一法,更多為了某種決策函數是否 admissible (容許的) 費盡力氣去探討。而論大中取小法則,考慮風險函數的最大值而取其小,先決條件是存在風險有界的決策函數。而這些,也和損失函數如何定有關,在一種損失函數下容許的決策函數,換了另一個損失函史是否依然具容許性?一種損失函數下的大中取小決策函數,是否換成另一個損失函數仍然是大中取小?即使用貝氏學派的想法,損失函數的不同仍可能造成期望損失最低點的不同,也就是貝氏決策將因損失函數而變。事實上頻率論決策方法如果採「平均風險」值做為選擇決策函數的判準,結果等同於在每一可能的隨機抽樣或實驗結果找貝氏決策。不同損失函數得出不同風險函數,不只在於其絕對數值,也在於不同決策函數間的比較:

E[L1(δ1,θ)] < E[L1(δ2,θ)]   ==\=>  E[L2(δ1,θ)] ≦ E[L2(δ2,θ)]

等死的老賊 發表在 痞客邦 留言(0) 人氣()

我一直避談貝氏方法。事實上貝氏方法有兩種概念,它們導致相同決策,但解釋不同,而我個人想逃避的是所謂貝氏學派 (Bayesian) 的論點;但卻支持另一種很少人在談的觀點。

從決策的觀點,根據資料 x 做成決策 d(x),它在參數(或群體)值是 θ 時(本文中 θ 有時是參數的抽象代表,有時只是一點或一個值,有時又當成一個隨機變數,希望不會產生混淆)造成損失 L(d(x),θ)。假設 x 是從群體中隨機抽出,則對所有可能的 x 值做平均,也就是群體參數真值是 θ 時的期望損失為 R(d,θ), 對固定決策規則(決策函數) d 而言,R(d,θ) 是參數 θ 的函數,稱之為決策規則 d 的風險函數 (risk function)。要比較兩個決策規則的優劣,例如是用樣本平均數或中位數來估計一個群體的平均數,何者較佳,由於 θ 未知,必須比較兩個決策規則完整的風險函數。可是兩個風險函數 R(d',θ)  與 R(d",θ) 要比較並不容易,如果可以證實在每一 θ 點,某個決策規則的風險值都低於另一決策規則,例如 R(d',θ) ≦ R(d",θ) 對每一 θ 點都成立,並且在某些 θ 點是嚴格不等的,那麼表現一致較差的 d" 是不容許的 (inadmissible),當然要被淘汰。但是,很多時候決策規則是容許的 (admissible),也就是說可以證明不存在任何決策規則表現一致地較優,這樣的決策規則是否就沒問題?實際上「容許性」只是一個基本條件,符合容許性的決策規則也可能是毫無道理的,例如不看資料直接認定 θ = θ0 的決策規則,其風險函數在 θ0 處是最低的,沒有任何其他決策規則在此點的風險值比它低,甚至相等都難以做到。

當我們有許多不同決策規則可選時,完整風險函數的比較更顯複雜性。我們可能先去掉一些不具容許性的決策規則,然而這並不那麼容易,時常我們想證明一個特定決策規則都是很困難的。取而代之的,是把一個風險函數變成單一代表值,直接比較各決策規則的風險函數代表值,目標是選取一個風險代表值最小的決策規則。於是有兩個重要的方案:一是大中取小 (minimax) 準則,另一是平均風險或貝氏風險 (average or Bayes risk) 準則。大中取小準則就是以風險函數最大值

等死的老賊 發表在 痞客邦 留言(0) 人氣()

統計的本質是什麼?是大量資料的分析。雖然小樣本方法被提出後,有三五個數字資料就想來個統計分析的屢見不鮮,但大量資料的分析似乎才是統計的本義。

大量資料怎麼看?類別資料單一分類大概只能看看資料所代表的個體是否集中在哪幾類,或關注有哪些稀有類別,從而歸納出一些結論。如果類別是有順序的,我們不免會看看個體在這些有序類別之間的分布是否有些特殊規律?如果有兩種或多種分類方式,我們可能考慮做交叉分類,看看個體的交叉分類分布是否呈現什麼規則?對於數值性資料,我們可以觀察其分布形狀,其集中趨勢或中心位置,也可以看其分布廣度,或看有沒有特殊的、遠離其他資料的資料點;也可以看看這些資料是不是可以看成是兩個以上的群體併在一起的。如果有分類變數將資料分群,或本來就是多組資料合併進行分析,可以比較這些次群體資料分布有沒有明顯差異,對有序分群的資料還可觀察次群體間的差異有沒有特定規律。主要數值資料之外還伴隨有相關變數的資料,可以觀察主變數與相關變數的散佈情形、關聯情形。

以上描述了一些「統計分析」所做的,歸納起來就是尋找資料中蘊藏的規律和變異,以及發現異常。規律是常,變異是變,但變也是常,沒有變異就不是統計資料了。規律又是平均,變異指的是正常存在的變化,是正常範圍。而「異常」就是例外,是「正常」狀態下不應出現的,如一群資料中出現極少數離群點,這些離群點是不應存在的,它們的存在想來必然有特殊原因。統計假說檢定就是一種評判資料是否異常的程序,這種程序是事先定了所謂的「正常」是什麼(H0),而評判資料是否異於這所謂的「正常」。不談涉及評判的統計假說檢定,只談所謂的規律或常,例如平均,移動或滾動平均,迴歸函數方法,這等於是資料的平滑。換句話說,統計從資料中尋找規律的方法,就是一種平滑化的方法。計算平均數、分位數等來描述資料,也是潛在假設資料是規律性的。資料的平滑化操作就是想把資料的規律描述、表現出來。

等死的老賊 發表在 痞客邦 留言(0) 人氣()

實務上常有一種情形:研究對象是一個小群體,不適合或無需再抽樣,因而「理論上」所做的統計分析是敘述統計,什麼統計量的標準誤、信賴區間、統計假說等都和這群體無關。然而事實上研究者不這麼想,也不願意「只是」做敘述統計描述一下這個小群體的狀況。

真正的描述統計應用不是沒有,事實上許多政府統計,包括長川登記的週期性報告與一些普查的報告都是常見的例子;私人機構也會有群體資料蒐集及整理結果的報告。它們對蒐集資料的機構都很有用,是了解一個群體的重要資料。不過,除此之外,很多時候在這些群體資料背後,研究者還會假想有一個超群體的存在,而對此超群體進行統計推論。

一個典型例子是時間數列分析。時間數列每一期資料可能是當時某個群體的資料,也可能是對當時某個群體的抽樣資料,但是對時間數列的推論,事實上都是假設了一個超群體的存在,在這樣的假設架構下,即使每期資料都是當時的群體資料,因此整個時間數列可能是整段歷史群體(各期群體的整合)的一個群體結果,但在統計人員眼中,這些資料只是一個隨機過程的一個樣本路徑 (sample path) 的一個片段,而統計分析的目的就是藉由這一個樣本路徑的片段推論整個隨機過程的結構,用以解釋某些問題或預測此過程此路徑未來的可能變化。

等死的老賊 發表在 痞客邦 留言(0) 人氣()

統計中常假設我們要研究的是一個群體,藉由樣本資料對群體特性做推論。然而,有時候事實是:我們更關心個體。例如醫學上我們常聽(見)到罹患率、治癒率、平均存活年數等,都是關於群體的;但我們更關心個體:某疾病治療方法 A 成功率 90%, 治療方法 B 成功率 60%,看來明智的選擇是 A,但事實是否如此?對一特定患者而言,嚴格來說沒什麼成功率的問題,只有成功或失敗的問題,勉強要用「率」來描述,也應是該療法用於此患者的「成功機率」。成功率是一個統計數字,成功機率則是基本指標。如果同樣考慮群體,成功率可能是平均成功機率的一個良好估計,但把成功率用在個體上,等於用群體平均結果來代表個體,在訊息缺乏的時候是不得已的,但也只是「不得已」之下的無奈。

在關注群體的統計分析中,個體間的差異被當做隨機誤差,Xi = μ + εi;而實際上可能是 Xi = μi + εi 或 Xi = μi。當然實際上如果是前者,除非知道 μi 的模式,例如 μi = α + β Xi, 我們不可能區分完全無序的 μi 間的「個別差異」與純誤差 εi。如果純誤差是屬於測量誤差,尚可藉由重複測量來平均化誤差以減低誤差的效果,否則只能把 Xi 當做個體的真值。

從敘述統計來說,如果需要關注的是個體,我們將不會只滿足於描述群體的平均數、標準差、偏態、峰度,我們更要關注個體在群體的哪個位置及其影響。例如行政院主計處發佈去年(110 年)平均月薪 55.8K,然而這個數字與你我個人有多少關係?對一個月收入 25K 的人來說,頂多感嘆自己所得還不到平均值的半數,對一個月薪 300K 的人來說,那平均值只是個笑話。

等死的老賊 發表在 痞客邦 留言(0) 人氣()

統計是什麼?這是統計入門教本必有的一問。

有人說:統計,就是讓數字說話。然而,要讓數字說話首先得有數字,然後得有讓數字說話的方法。

統計還是個騙子, Mark Twain 說:“There are three kinds of lies: lies, damned lies, and statistics.”  有專書談到統計如何成了該死的謊言,或者說是騙子,Joel Best 的 “Damned Lies and Statistics: Untangling Numbers from the Media, Politicians, and Activists” 是個例子。

等死的老賊 發表在 痞客邦 留言(0) 人氣()

統計離不了誤差;因為有誤差所以需要統計。但,如果誤差不能隨機化,統計也派不上用場。

有資料才有統計,但如果資料的規律都是確定的,例如 1, 4, 9, 16,… 是 1, 2, 3, 4,… 的平方,一個數學式 n^2, n=1,2,3,4,… 很好地描述了這個序列。但如果是 1, 4, 7, 15 你是否能說什麼?如果這序列再延伸: 1,  4, 7, 15, 26, 36, 47, 64,  80, 101 至此應該很容易看出它是 1 至 10 的平方,摻雜了誤差 0, 0, -2, -1, 1, 0, -2, 0, -1, 1。實際上這是用 n^2 加上一個標準常態亂數化整來的。 如果誤差更大,如  -1, 8,  11, 19, 19, 41, 47, 60, 81, 101, 如果知道它對應 1~10,大概還能猜出它和 n^2 相關;如果不知它是對應 1~10,恐怕也難以想像它是由 n^2 加上誤差的結果。統計,最基本的是由一堆資料中找規律;如果這堆資料是所謂「樣本」,那就進一步推論「群體」的特性;如果是像前例序列資料,就可「預測」接下來大概是 121, 144, 169,...。

假設這麼一個群體: 1 至 1000,自其中「隨機」抽取16個當做樣本,這個群體有平均數 500.5,標準差 288.8。理論上抽取 n=16 的樣本,其平均數也在 500.5「附近」,但因為是「隨機」抽樣,實際抽到的樣本其平均數自成一個機率分布,標準差是 72.2,所以實際的樣本平均數大約 65% 的機會落在 428~573 之間,大約 90% 落在 356~645 之間。以下就是一個實際抽樣結果:

等死的老賊 發表在 痞客邦 留言(0) 人氣()

Nature 2019年3月號一篇 "Scientists rise up against statistical signifance" 再次掀起對  "統計顯著性" 甚至對 "p 值", "信賴區間" 等的反對聱浪,而在中文網路,它又似乎被認為是對 "p 值" 的反對,是統計基礎的崩塌。

究竟我們從 "統計資料"  中想獲得什麼? 只是陳列觀測數據, 或是看出一些關於這些數據的規則, 或是由局部 (樣本, sample) 推測全體 (群體, population).  很多的統計關注、應用都來自於從樣本推論群體,因而很多的爭議也來自於此。

認真說起來,,統計是令人很無力的。統計資料充滿了不確定性及誤差,從群體到樣本又是一些偏誤和誤差。理想的統計學不考慮抽樣隨機誤差以外的各種誤差、偏誤及不確定性,但究抽樣隨機誤差一項就無數風雨了。不說什麼,單 "隨機" 二字就愁煞了人,無人可解釋清楚什麼是 "隨機",即使專業是統計的人都總是誤解,更遑論對統計一知半解或全然不懂的人?

等死的老賊 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼