近日,柯文哲談及大法官時,稱:他不相信15位大法官都是偏向民進党的,因為「 n 大於等於 15 就會接近常態分配。」本文不談政治,只想就「 n 大於等於 15 就會接近常態分配」這句話談談其中的謬誤。
首先,這顯然是很常見的,把中央極限定理中「統計量(樣本平均數)的抽樣分布」和樣本的分布,或稱「樣本分布」給搞混了;其次,就中央極限定理而言,"n ≧ 15" 這條件的適用性問題;最後,是「偏向」與否並非中央極限定理能解決的問題。
就第一個問題,若是大法官的偏向可以用一個尺標來表現,X 代表潛在的大法官偏向尺標,X{1}, ..., X{n} 代表現實中 n 位大法官各自的偏向指標,可以當成從 X 群體抽出的樣本。這樣本怎麼抽出呢?如果是自具有 X 的分布的群體中依簡單隨機抽樣抽出的,我們可以說:諸 X{i} 所形成的這樣本分布 (sample distribution) 具有和 X 群體分布接近的特性,而我們要檢視的那句話,意思是 n ≧ 15 則該樣本分布接近常態,但這卻是大大地錯了!如果 n 夠大,機率學的定理,根基於大數法則,樣本分布只會趨近於群體分布;除非 X 就服從常態分布,並且採用的是隨機抽樣,否則樣本分布不會趨近於常態。但,大法官的選任顯然不是隨機的(可參考「隨機很重要」一文),也沒有理由說 X 的分布是常態的,因此那句話的由來應是中央極限定理: