[界定]

隨機樣本: 以事先可確定群體各成員被抽出機率, 並且群
    體中每一成員都有被抽出機會(被抽出機率為正值)之
    抽樣方法所抽取的樣本. 合格的隨機樣本必須對群體
    有明確界定, 並妥善規劃抽樣程序, 嚴謹執行, 使樣
    本對象(個案)之被選取純由於機會.

便利樣本: 於群體成員經常出現處, 以不甚嚴謹的方式決
    定樣本個案. 例如: 為了解百貨公司消費者行為而至
    某些百貨公司抓人面訪; 為了解買書者偏好而至某些
    書店找人填調查表; 學校中要調查學生意見而在一些
    班級找人調查. "便利樣本" 不同於 "隨便樣本", 後
    者如學校學生調查就找一些熟人填表或代發問卷即是.

立意樣本: 調查者設定 "樣本個案" 應符合之條件. 群體
    成員中符合此條件者, 皆為樣本個案; 不符條件者,
    即非樣本個案. 有時符合條件者多, 則另訂從符合條
    件者之中選擇樣本個案之原則. 這些選樣標準與原則,
    均在調查設計中事先明訂. 例如: 為預測景氣變動,
    選取股票上市公司中各行業前三大公司, 訪問其總經
    理或執行長.

自願回覆樣本: 受調查之樣本個案, 係基於自發或某些要
    素誘導而來. 例如: 讀者意見、讀者投書、call-in、
    網站設立問卷或投票、bbs/news 散發問卷等皆是.


讓我們來看看, 為甚麼只有隨機樣本適合做統計推論 (由
樣本推論群體特性. 這項推論必須能做錯誤機率或誤差幅
度的評估.)


假設群體有 10 個成員, 其 "觀測值" 僅有被選中之樣本
可觀測到. 每個成員附帶一些 "特性" 是可以預先得知的.
群體成員可表示為 (Z1,Y1),(Z2,Y2),...,(Z10,Y10). 一
個 "抽樣設計" 即是付予這些成員被抽選為 "樣本個案"
的機率結構 --- 實務上隨機樣本至少可計算 (1) 各成員
被抽中機率; (2) 兩成員同時被抽中機率.

為說明方便, 我們將各 Zi 值設定好. 群體成員如下:
 (1,Y1),  (2,Y2), (4,Y3), (5,Y4), (7,Y5),
 (12,Y6), (18,Y7), (25,Y8), (27,Y9), (40,Y10)

目標是推論群體 {Y1,...,Y10} 的某些彙總特性, 例如 Y
的 "群體平均數" μ=(Y1+...+Y10)/10.

假設以簡單隨機抽樣選取兩個成員 (X1,X2). 這 (X1,X2)
可能是 (Y1,Y2) 也可能是 (Y7,Y10) 也可能是其他組合.
我們只看到 (X1,X2), 或許可知道就是 (Y8,Y3). 但我們
不知其他 Yi 值是多少.

由於採簡單隨機抽樣, 我們知道 Y1,...,Y10 每一個被選
中的機率都是 1/10; {Y1,Y2},{Y1,Y3},...,{Y9,Y10} 每
一組何被選中的機率是 1/45. 因此,由初級統計課程我們
知道可以由 (X1,X2) 對群體平均數μ及標準差σ做猜測,
從而知道 (X1+X2)/2 與 μ 相差大約是怎樣的幅度 ---
更精確地說,是 "相差幅度超過某一幅度的機率可以計算".


以立意樣本來說, 如果選樣標準是 "Z值最高與最低的",
則樣本是 (Y1,Y10). 注意 Y2,...,Y9 完全被這選樣標準
給排除, 沒有任何機會被選到. 若選樣標準是 "Z值居中"
的兩個, 則樣本是 (Y5,Y6), 而其他成員沒有任何出線機
會. 我們說 "機會" 是指在決定了怎樣抽樣之後. 在隨機
抽樣, 決定了 "簡單隨機" 之後, 前述機率就確定, 而各
成員 "人人有機會". 而在 "立意選樣", 機會取決於選樣
標準決定者; 一旦選樣標準定了, 樣本(理論上)就完全確
定了. 在這樣的情形下, 除非 Zi 可以很準確地預測 Yi,
否則如何得知 (Y1+Y10)/2 或 (Y5+Y6)/2 與μ相差幾何?


或許有人會迷惑: 隨機抽樣也可能抽到的樣本是(Y1,Y10)
或(Y5,Y6), 為甚麼就可以評估其(樣本)平均值與μ的差?

實際上我們當然不知 (X1+X2)/2 與 μ 相差多少! 因此,
前面特別強調在隨機抽樣我們能算的是 "相差幅度超過某
一幅度的機率". 而在立意樣本, 既無隨機性,當然沒有所
謂 "機率" 可言!

因此, 我們很清楚: 隨機樣本可用以推論群體 (伴隨誤差
或其機率的評估); 而立意樣本只可用於對群體的 (少數)
特性 (如μ) 做猜測, 卻難以評估這項猜測的誤差!

立意樣本除了難以評估誤差之外, 若主事者對群體特性了
解很深, 能找到適當選樣準則, 有可能獲得就特定目標而
言比隨機樣本更好的樣本. 例如若 Yi 與 Zi 有高度相關,
立意選取 (Y1,Y10) 或 (Y5,Y6) 或 (Y2,Y8) 可能比隨機
抽樣更能準確估計μ. 問題是即使只要估計μ而非對Yi的
分布做更精細的推論, 事先又如何能確知 Y 與 Z 的關係
恰如預想的? 而隨機抽樣藉著機率法則, 雖然不能確保獲
得最準確估計值, 若樣本數不太小 (如此處舉例 n=2, 顯
然太小!) 卻也防護(避免)了過大誤差的可能性(大誤差的
機率低).


就便利樣本而言, 它不是隨機樣本, 沒有隨機樣本的自動
防衛機制; 它也不像立意樣本, 主事者沒有像立意抽樣時
那樣謹慎研究過群體特性再做出可能是極佳選擇的選樣標
準. 相對地, 便利樣本貪求選樣的便利性, 卻可能因此得
到品質很差的樣本.

為甚麼這麼說?

首先, 便利樣本的選取, 常常一開始就沒有界定好 "群體".
例如: 到街頭、百貨公司、大書店去找人填問卷或接受訪
問, "群體" 是怎樣界定的? 群體中各成員都有機會受訪?
以百貨公司顧客而言, 有些是不親自出門採購, 有些是上
街時間與你的調查時間不同, 有些是剛好在你調查時沒來.
而你抓到的對象, 可能根本不是顧客只是碰巧當時來了.
群體界定不清, 你的樣本要代表誰?

在 "便利" 的考量下, 能被選到的成員是調查期間出現在
調查人員眼前的; 然後調查人員經由不明確的準則決定是
否將該成員列入調查. 而在樣本數限制下, 調查結束時間
有點機會性 (依群體成員出現情形及每一個案完成訪查時
間而定), 同時也決定於調查人員的執行.

以這裡考慮的例子來說, 假設群體成員出現順序如下:
   (12,Y6), (5,Y4), (18,Y7), (25,Y8), (27,Y9),
   (40,Y10)
並非群體的所有成員都會出現!

很可能調查人員認為訪查第一個出現的成員是不隨機的,
於是(12,Y6)跳過. 第二個成員(5,Y4)可能被認為 Z=5 偏
低而不取.  第三個成員(18,Y7)可能看起來不友善而跳過.
於是第四個成員 (25,Y8) 被選取了. 接下來(27,Y9)是否
會被相中倚賴幾項因素: 時間上來不及? 覺得 "不隨機"?
擔心無法完成應抽查案數? 看起來好不好說話? 調查員個
人好惡? ... 最後完成的樣本可能是 {(25,Y8),(27,Y9)}
或 {(25,Y8),(40,Y10)}.

是否此例太極端? 這個例子的結果不是重點! 重要的是這
樣選到的樣本可能是怎樣的樣本? 它能代表群體嗎? 就以
μ的推論而言, 記得統計推論除了是由樣本推論群體特性
以外, 必須能做誤差幅度的評估. 但我們不可能確知樣本
平均(或其他估計量)與群體參數μ之間的真正誤差, 因而
在隨機抽樣也只能藉著機率理論評估發生不同誤差幅度的
機率. 明確地說, 必須至少能知道群體中每一個別成員被
抽中的機率P(i),及每一對成員同時被抽中的機率P(i,j).

以便利樣本而言, P(i)決定於:
。群體各成員出現在調查員面前的機率及
。調查員對出現在其面前的每一對象是否選為樣本的機率.

就前者而言, 如何能評估各該機率? 沒辦法! 沒理由假設
每一成員出現機率都相同; 而各成員出現機率取決於多項
觀測不到的因素.

就第二項而言, 由於並沒有嚴謹的選樣原則及切實執行,
其機率取決於調查員不明確的判斷, 該判斷將因調查員本
身特質及調查時心情、個別調查對象之外表、調查時間及
環境現況等. 這些因素會隨時改變且其變動模式難以評估.

如上述一階被包含機率P(i)就難以評估, 二階機率P(i,j)
更不可能.

立意樣本的選樣標準是由深入了解群體特性及調查目的的
人決定的, 如此的樣本雖無法以機率模式評估它與群體的
差異, 在估計特定參數時尚能不致相差太多; 但便利樣本
的P(i)決定於不明確且易變的因素, 而且這些影響因素是
由受查對象及對群體了解不深也未能深思熟慮的執行調查
人員互動的結果, 因此不僅不能依機率理論做推論 (及評
估誤差), 也容易產生幅度不易評估,甚至方向也無法掌控
的偏誤.

自願回覆樣本(voluntary response sample)結果可信嗎?
“統計, 讓數字說話”(鄭惟厚(譯) Moore, D. S.(著))
中有一個例子:
。專欄作家 Ann Landers 有一次問讀者︰「如果可以
  重來一次, 你要孩子嗎?」結果接到將近1萬份答覆,
  其中接近70%說︰「不要!」
。Newsday 辦的專業全美抽樣調查, 1373位樣本父母,
  其中91%表示會要孩子。
Moore 等(2003)的統計教本 "The Practice of Business
Statistics --- Using Data for Decisions," p.173 舉
了另一個例子:
。The ABC network program Nightline once asked
  whether the United Nations should continue to
  have its headquarters in the United States.
  More than 186,000 callers responded, and 67%
  said “No.”
。It is not surprising that a properly designed
  sample showed that 72% of adults want the UN
  to stay.
如果你硬是不相信統計抽樣原理, 那沒辦法! 我無法說服
你只調查一千多人但符合隨機抽樣原理的結果可以比一萬
份甚至十幾萬份自願回覆的結果更可信. 然而, 正確的抽
樣理論告訴我們: 嚴謹設計及執行調查的結果, 與樣本數
多了數倍的自願性回覆有那麼大的差距, 足以證實自願回
覆樣本之不可信.

或許有人雖接受 "自願回覆樣本不可信" 的結論, 卻不認
同 "網頁問卷" 是自願性回覆樣本之一型?

如果網頁問卷結果可認為是隨機抽樣, 其群體界定是甚麼?
個別成員被抽中機率是多少? 成對成員同時被抽中機率又
是多少?

事實上, 就像便利樣本, 上網填你的問卷的人, 只是恰巧
出現. 你可以認為那是隨機行為, 但卻無從評估其機率!
即使你四處張貼求爹叫娘的文章也是一樣, 此舉只不過是
改變部分上網人口填問卷的機率, 卻無法改變 "機率無從
評估" 的死角. 以符號表示, 就是前述 P(i) 及 P(i,j)
完全由成員(i)或成對考慮(i,j)決定, 你的求救文可能改
變了某些P(i)/P(i,j), 但你不知結果, 也不知改變幅度.

一項 "網路上統計調查偏誤之研究"(NSC89-2118-M006-017,
NSC90-2118-M006-012)在同一網站先後做了五個問卷調查
實驗(調查為名,合併為一項實驗), 證實不同主題的問卷,
其結果將有顯著差異:

           問卷1   問卷2    問卷3   問卷4    問卷5
   樣本數   226     365     1084    289     1276

   性 別
    女     58.85   69.59   74.82   24.22   60.28
    男     41.15   30.41   25.18   75.78   39.72


   年 齡
   不滿15   1.77    1.92    1.85    0.00    1.80
   15~19   38.05   46.30   49.26   37.37   49.92
   20~24   42.92   42.74   41.51   50.87   37.85
   25~29   11.95    6.30    5.81    9.00    8.54
   30~34    3.10    2.74    1.11    2.08    1.57
   35~39    1.33    0.00    0.18    0.35    0.31
   40以上   0.88    0.00    0.28    0.35    0.00

但基本人口特性的差異只是次要. 五個問卷調查時間長度
是一致的(報告中未找到調查時間,似乎是各一星期?)不同
主題吸引不同數量的回應者, 也吸引了不同特性的回應者.
更重要的是: 回應機率 P(i) 會與調查者(研究者)有興趣
的反應值有關, 也就是與 Yi 有關, 而這是由回應資料無
法評估的! "自願回覆" 等於 "自我選擇的偏誤" (self-
selection bias). 而這項偏誤,在許多時候發生於反應變
數的, 可能遠大於前列基本人口特性上的同類偏誤.

如果我們能夠以基本人口特性準確地預測反應 (態度、傾
向或行為), 那麼偏誤是可以校正的, 因為可由其他管道,
取得群體人口特性結構的良好估計. 然而, 事實上人的反
應可說是不能預測的. 一些社會學研究, 其行為預測模型
的解釋力幾乎都偏低. 以普通複迴歸模型為例,其 R^2 多
只能有百分之二十幾或更低, 這其中可能還用到並非基本
人口特性的解釋變數. 德國 ZUMA online research 的研
究人員 Bosnjak, M. 專門從事網頁調查研究。他在 2000
年第55屆 American Association for Public Opinion
Research Annual Conference 中報告網頁調查之 item
nonresponse,  以複迴歸模型分析一些如態度等主觀指標
對 "傾向答題" 及 "實際答題" 行為的影響。結果複判定
係數在答題傾向方面只得11%;在答題行為方面只得7.3%。
這結果考慮了態度對意向及行為的影響, 而如果只考慮基
本人口特性(才有其他來源資料可用於校正偏誤), 你能期
望有更好的結果嗎?

因此, 你能信賴網頁調查的結果嗎?

在BBS或news隨性地張貼問卷, 或利用萬維網頁放置問卷,
不僅其將代表的群體不明確,事實上其結果也不能代表調
查者心目中欲代表的群體。

立意取樣

[20060817]

立意樣本: 調查者設定 "樣本個案" 應符合之條件. 群體
    成員中符合此條件者, 皆為樣本個案; 不符條件者,
    即非樣本個案. 有時符合條件者多, 則另訂從符合條
    件者之中選擇樣本個案之原則. 這些選樣標準與原則,
    均在調查設計中事先明訂. 例如: 為預測景氣變動,
    選取股票上市公司中各行業前三大公司, 訪問其總經
    理或執行長.


[20000413]

※ 引述《ellesse.bbs@bbs.es.ncku.edu.tw》之銘言:
: ==> yhliu.bbs@bbs.ncku.edu.tw (....) 在文章中提到:
: : 以抽樣者主觀意識選擇特定樣本。
: : 例如: 物價調查之商品選擇, 即是以立意方式
: : 決定各類代表商品; 以該類樣本商品之價格變
: : 化代表整類商品之價格變化。
: : 又如: 景氣調查以某些「代表性」商家老闆之
: : 意見代表企業界對景氣的預期。
: 那可否在請問一下,
: 這樣所做出的結果,不就是會有滿大偏差嗎?
如果標準設定不當, 就會有很大偏差.

: 那為何還會用『立意』取樣?
有些情況立意取樣可能用較少樣本取得可用資訊.
例如物價調查, 固亦可用隨機取樣自眾多商品抽
樣, 但一則可能需調查較多項商品以控制抽樣誤
差; 再則如抽中之商品具短期性, 週期性, 則造
成日後調查其價格變動的困難.
再如企業界對景氣的預期, 亦可盲目地抽取代表
性業者; 但業者對市場景氣的了解和洞見不一定
同等. 大企業或企業名人對景氣變動的洞察力可
能較敏銳, 且他們的看法導引他們的行為, 進而
影響景氣. 因此, 若適當決定 "代表性" 的準則,
立意樣本可能可以更準確預測景氣變動.

不過, 如前述, 立意取樣通常會有很大偏差 (所
謂 "代表性" 很難適當評估) 且結果不適合做推
論性的統計分析, 因此, 很少適用場合.

: 是否有文章或書本在介紹『立意』取樣?
我沒涉獵這方面的研究. 在一般 "抽樣方法" 的
書可能有簡單介紹. 但因此法獲得的資料不適合
做統計推論, 很少書, 很少作者會去做深入討論.

[20050409]

※ 引述《imuya.bbs@bbs.wretch.cc (僕生道)》之銘言:
> 在哪些情形之下,
> 以分析 非機率抽樣樣本(nonprobability based sample)來產生研究結果
> 會比 分析機率抽樣樣本(proobability based sample)還要來的好??
在哪些情形下非機率抽樣得到的結果較好?

何謂 "好"?

如果考慮成本, 很多時候我們需要非機率樣本. 例如群體
難定樣本難找的研究主題, 如醫學研究中的罕見疾病研究,
社會學研究中以嚴重違反社會道德規範之事實或行為為主
題的研究. 例如物價調查中查價項目的選擇. 例如景氣預
測.

但如果 "好" 是指代表性, 則機率抽樣恐怕是唯一方法!

物價調查之查價項目, 在台灣是以立意及主觀方式選定,
在美國據以前聽到的說法是以隨機抽樣方式決定. 景氣預
測除根據客觀的經濟指標以外, 是對大企業領袖的調查,
也就是詢問他們的看法.

立意(判斷)樣本可能在 "平均" 的表現上良好, 但在 "變
異" 的代表性卻不足! 景氣調查大企業領袖的評估可能接
近事實, 因為大企業的表現帶動中小企業. 然而, 在少數
大企業領袖之外的中小企業雄兵, 是景氣中的變異. 猛虎
難敵群猴, 完全聽所謂大企業領袖的話可能是不智的! 再
說, 所謂 "大企業" 又豈只少數幾家? 以判斷樣本中的判
斷規則將群體分層, 再做分層隨機抽樣, 豈不更有代表性,
更能抓住全貌?

非機率抽樣中的 滾雪球樣本 有代表性嗎? 做為一個在群
體訊息不足無法隨機抽樣情況下蒐集初步資料的方法, 它
是個好方法; 但要談代表性, 恐怕是很有問題的!

質性研究採用立意樣本, 焦點團體, 配額樣本或滾雪球樣
本, 各有其不同考量. 但這些樣本就 "代表性" 而言, 個
人認為是不能跟機率樣本相提並論的! 質性研究的關鍵不
在於代表性樣本, 而在於如何從樣本得到有深度有意義的
訊息. 如果在質性研究中要併合量化研究, 樣本要代表群
體, 那麼, 隨機抽樣仍是必要的.

有一種情況不能做隨機抽樣而只能系統抽樣, 那就是像樂
曲或圖像的抽樣, 群體訊息不在於各點單獨的表現, 而在
於其相互關係. 此種資料的抽樣, 必須抓住其相互的關聯
性. 而能以抽樣取代全體, 是因其各點間之關聯具有規則
性, 而這種規則性正是我們要的.

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 等死的老賊 的頭像
    等死的老賊

    劉應興的部落格

    等死的老賊 發表在 痞客邦 留言(0) 人氣()