選舉民調結果準確性比較 (2024封關前)－劉應興的部落格

除美麗島民調可查到元月 11-12 日調查結果外，其他都是封關前民調。民調及實際得票結果如下：

調查機構	民調支持率			估計得票比
	賴蕭	侯康	柯盈	賴蕭	侯康	柯盈
實際得票率	28.58	23.89	18.88	40.05	33.49	26.46

聯合報	32.00	27.00	21.00	40.00	33.75	26.25
etTODAY	38.90	35.80	22.40	40.06	36.87	23.07
2024選舉溫度計	38.33	37.05	24.61	38.33	37.05	24.61
tvbs	33.00	30.00	22.00	38.82	35.29	25.88
鏡新聞	35.60	24.10	24.20	42.43	28.72	28.84
三立	30.90	27.90	23.80	37.41	33.78	28.81
菱傳媒	36.89	32.83	28.64	37.51	33.38	29.12
台灣民意基金會	32.40	28.20	24.60	38.03	33.10	28.87
美麗島	39.60	28.50	18.90	45.52	32.76	21.72
美麗島(1/11-`12)	35.40	24.70	19.90	44.25	30.88	24.88
民眾党(求真)	27.20	26.40	26.90	33.79	32.80	33.42
國民党(市+手)	27.20	25.60	22.40	36.17	34.04	29.79
國民党(市話)	29.20	30.20	14.30	39.62	40.98	19.40
國民党(手機)	23.50	17.10	37.40	30.13	21.92	47.95

表中得票結果對應民調支持率的是得票率，是以總選舉人數為母數的得票率；另外得票比例（以有效票數為母數）對應民調所謂「估計得票比」，即民調中有表態支持哪一組的人為母數。但民調中未表態人比例並不等於未投票及廢票比例，兩者雖有相關，但完全是不同概念。不考慮民調與投票日至少相差 11 日，中間民意當然會有變化，也不考慮投票率高低嚴重影響投票結果，單以最終結果來說，顯然聯合報結果最準確，百分率至小數點之後才‵有差異。除三党內參民調之外，僅鏡新聞對侯康配一組結果偏低，另兩組雖略偏高但大致在誤差範圍——因剔除未表態的，民調結果之「估計得票比」之統計誤差當然高於支持率，如果民調支持率的誤差大約 3 個 % 的話（樣本數略多於 1000），得票比的誤差大約高出 20-40%。很遺憾的是三党的內參民調（如果美瓏島民調是民進党內參）都與投票結果不一致，是因選舉策略而對外做誇大己身支持率，或是因封關民調與投票日有差距民意改變，或是投票率所致，或是支持意向與投票行為之間的落差則不得而知。反過來說，因為民意改變、投票率偏低、棄保心理等因素，上述民調結果與投票結果的吻合，反而是很奇怪的現象，如果這是「理所應當」，那是否意謂民調封關後那十天的競選活動、棄保操作都無效？而且民調未表態與不投票行為幾乎可以等同？

再看三家內參民調，參考國民党市話和手機民調的結果，美麗島民調也是全市話，和國民党全市話民調相比，賴蕭偏高而侯康偏低，至於柯盈估計得票比偏低的現象倒是符合市話民調的特色。國民党內參民調長達兩週１２月１５日至２８日，在瞬息即變的選舉民意，這樣的調查是很奇怪的，如果調查順序與地區、人口特性無關，算是調查期間的民意表現吧，但結果也算是離投票日較遠了，按理其結果應有較大差異。民眾党內參民調兼採市話和手機，其結果介於國民党內參民調市話和手機之間，這是合理的。不過民眾党上列封關前最後一次民調結果是三足平衡鼎立，和實際得票比差異不可謂不大，引來「做假騙票」之疑。然而民調花費不小，沒有人會花錢做假資料騙自己，假設民眾党真的發佈的是假結果，因其宣稱原始資料都可公開，是否意謂其所公布資料自始都是假的？若真如此，為何都無流言傳出？以下為民眾党內參民調在登記日後各次結果：

民眾党內參民調
		支持率				估計得票比
調查日期	樣本數	賴蕭	侯康	柯盈	未表態	賴蕭	侯康	柯盈
1126-27	2009	33	25	29	13	37.9	28.7	33.3
1207-08	1216	29.9	24.3	27.6	18.2	36.6	29.7	33.7
1209-10	1217	34.3	22.9	24.5	18.3	42.0	28.0	30.0
1216-17	1225	31.5	25.8	27.2	15.5	37.3	30.5	32.2
1220-21	1217	30.3	25.2	26.7	17.9	36.9	30.7	32.5
1225-26	1226	33.4	24.8	26.0	15.8	39.7	29.5	30.9
1226-27	1241	31.7	22.7	28.7	16.9	38.1	27.3	34.5
1230-01	1826	27.2	26.4	26.9	19.5	33.8	32.8	33.4

從調查估計之支持率來說，未表態比例大抵在 15-20% 範圍，最後一次調查竟然是最高的。除卻投票率問題，我們是否可以揣測未表態者都不可能投票給柯盈？也就是說支持柯盈這一組候選人的，在民調中都表態了，所以 26.9% 就是其得票比的上限（估計）。若這樣的猜測成立，那麼實際投票結果得票佔比 26.46% 可說是很合理了。另外我們還可看到一個特殊結果：1207-08 和 1209-10 接連兩次調查其結果竟然有相當大差異，特別是賴蕭支持率 29.9% 與 34.3% 相差 4.4 個百分點，如果兩次調查樣本是獨立抽取的，單次調查 3% 的統計誤差，兩次調查的誤差界限應是 4.2%，所以 4.4% 的差距令人對調查機構的調查結果可信程度有些疑慮。不過，也可能這仍只是偶然，畢竟即使只有 1% 機會發生的事件也是可能發生的，另外就是也許因為樣本需要加權以修正偏誤，使統計誤差超過簡單隨機抽樣的誤差，所以單一支持率的統計誤差不只 3 個百分點。但總體來看，似乎看不出民眾党封關前最後一次公佈民調結果有灌水「騙票」證據。或者我們應說：那些看起來準確的民調不一定真的「準確」，只是巧合；而那些看起來不準確的民調，也許是我們沒有看懂民調結果真實意含？

國民党的手機和市話調查結果之差異也讓我們不得不對民調結果的「準確性」保持懷疑態度。如果不論市話樣本或手機樣本，都經適當加權校正樣本性別年齡別教育程度等之結構性偏誤，我們期望任一種樣本都能適當估計支持率或估計結構比，即使各自仍存有些偏誤，其差距應不大；但實際上以未表態比例而言，市話樣本是 26.3%，手機樣本是 22.0%，用簡單隨機樣本算法，兩樣本之未表態比例已達 0.05 顯著水準，三組候選人支持率，29.2%, 30.2%, 14.3% 對 23.5%, 17.1%, 37.4%，結果差距更是明顯。也就是說：市話樣本和手機樣本各自對應的群體，並不只是性別年齡別等可用加權校正的選民屬性結構不同，而是有根本的不同。既然如此，在兩群體無法明確區分界定，也就無法知道如何估計兩群體的支持偏好分布，也無法適當地將兩群體支持率適當平均，所以即使同時採用手機和市話樣本，其樣本配置，例如市話 70% 手機 30%，也是任意的，我們又憑什麼認為目前各機構的調查結果能準確預測選舉結果？所以說：所謂某民調結果準確，只能說是巧合。

國民党內參民調
		支持率				估計得票比
調查日期	樣本數	賴蕭	侯康	柯盈	未表態	賴蕭	侯康	柯盈
1215-28
市話	3258	29.2	30.2	14.3	26.3	39.6	41.0	19.4
手機	1755	23.5	17.1	37.4	22.0	30.1	21.9	47.9
合併	5013	27.2	25.6	22.4	24.8	36.2	34.0	29.8

前面說得票比的誤差大約比支持率高出 20-40% 是粗略的，把調查中未表態比例當做無誤差來計算的，或者說是在已知未表態比例下的條件誤差。實際上未表態比例和各組候選人支持率都是同一調查同一問項的結果，因此未表態比例本身也有誤差，並且兩比例的誤差是負向相關。令實際支持率為 p，不表態比例為 r，對應的調查結果（兩比例之估計）分別為 x 與 z，則

x/(1-z) = p/(1-r) + [(x-p)(1-r)+p(z-r)]/(1-r)^2．(1+(z-r)/(1-z)]

用 x/(1-z) 估計 p/(1-r) 其隨機誤差項是 ε(1+(z-r)/(1-z)]，其中

ε = [(x-p)(1-r)+p(z-r)]/(1-r)^2

一般的統計量誤差是所謂 1/√n 級，數學符號 Op(1/√n)。如果 T 是這種統計量，意謂 √n T 有一個極限分布，粗略地說，T 的絕對期望值 E[|T|] = O(1/√√n)，數學符號 Op(．) 和 O(．) 一是用在隨機量（有一機率分布），另一是用在確定（非隨機）量。上列主誤差幅度 ε 的分子是 x-p 和 z-r 的加權和，分母 (1-r)^2 是確定量，因此 ε 是 Op(1/√n) 隨機量。事實上

E[ε] = 0

Var[ε] = [(1-r)^2 p(1-p) + p^2 r(1-r) - 2p(1-r)pr]/[n(1-r)^4]
= p(1-p-r)/[n(1-r)^3]

上列公式是假設簡單隨機樣本計算的，不過因為民意調查常存在不可忽視的樣本代表性問題，需利用加權處理以減少偏誤，實際上抽樣誤差，例如以上列變異數衡量，究竟比簡單隨機抽樣高或低不得而知；但實際上加權因子有多項，通常用多變數覆加權或稱 raking 技巧處理，更難以計算正確的抽樣誤差，所以上列公式還是可當作一個參考，一般民調大概也多如此。

由於 1-p-r = (1-p)(1-r) - pr，因此可以說

E[x/(1-z)] ≒ p/(1-r)

Var[x/(1-z)] ≒ p(1-p)/[n(1-r)^2]

與假設 z = r 無誤差的計算式一致。

在修正因子用 x/(1-z) 估計 p/(1-r) 其隨機誤差項是 ε(1+(z-r)/(1-z)]，也就是說 x/(1-z) 的期望值實際上不是 p/(1-r) 而是有些偏誤

E[ε(z-r)/(1-z)] ≒ E[ε(z-r)/(1-r)] + E[ε(z-r)^2/(1-r)^2]
= E[(1-r)(x-p)(z-r)+p(z-r)^2]/(1-r)^3
+ E[(1-r)(x-p)(z-r)^2+p(z-r)^3]/(1-r)^4

第一項經計算正好是 0；第二項是 O(1/n^2)，可以忽略，也就是說用 p, r 的 Op(1/√n) 誤差等級不偏估計 x, z 分別估計，然後以 x/(1-z) 估計 p/(1-r)，其偏誤很低，完全可以忽略。而 x/(1-z) 的誤差，粗略地可以當作 z = r 即 r 的估計無誤差來計算，與用 x 估計 p 相比只是誤差的擴大，在標準誤或所謂信賴區間誤差界限尺度上是擴大為 1/(1-r) 倍（在變異數尺度上是 1/(1-r)^2 倍）。前面說的增長 20-40% 是因 1/(1-r) = 1 + r/(1-r)，其中 r/(1-r) ≒ z/(1-z) 大略在此範圍。