統計中常假設我們要研究的是一個群體,藉由樣本資料對群體特性做推論。然而,有時候事實是:我們更關心個體。例如醫學上我們常聽(見)到罹患率、治癒率、平均存活年數等,都是關於群體的;但我們更關心個體:某疾病治療方法 A 成功率 90%, 治療方法 B 成功率 60%,看來明智的選擇是 A,但事實是否如此?對一特定患者而言,嚴格來說沒什麼成功率的問題,只有成功或失敗的問題,勉強要用「率」來描述,也應是該療法用於此患者的「成功機率」。成功率是一個統計數字,成功機率則是基本指標。如果同樣考慮群體,成功率可能是平均成功機率的一個良好估計,但把成功率用在個體上,等於用群體平均結果來代表個體,在訊息缺乏的時候是不得已的,但也只是「不得已」之下的無奈。
在關注群體的統計分析中,個體間的差異被當做隨機誤差,Xi = μ + εi;而實際上可能是 Xi = μi + εi 或 Xi = μi。當然實際上如果是前者,除非知道 μi 的模式,例如 μi = α + β Xi, 我們不可能區分完全無序的 μi 間的「個別差異」與純誤差 εi。如果純誤差是屬於測量誤差,尚可藉由重複測量來平均化誤差以減低誤差的效果,否則只能把 Xi 當做個體的真值。
從敘述統計來說,如果需要關注的是個體,我們將不會只滿足於描述群體的平均數、標準差、偏態、峰度,我們更要關注個體在群體的哪個位置及其影響。例如行政院主計處發佈去年(110 年)平均月薪 55.8K,然而這個數字與你我個人有多少關係?對一個月收入 25K 的人來說,頂多感嘆自己所得還不到平均值的半數,對一個月薪 300K 的人來說,那平均值只是個笑話。
從推論統計來說,如何能把誤差 εi 分離出來是重點,但這和資料本身的性質有關。例如前述醫療效果問題,如果我們假設個體的 μi(如治癒機率)是無序的(因為有無序的個別差異),那麼根本沒有辦法對 μi 做任何推論,因為治療前不能預知結果,而最後結果只是單一數字。在這種情形下,只能集合類似個體成一群體,或假設 μi 有固定結構如 μi = α + β Xi 而在這群體中做抽樣以便推估此結構的參數,最後則可應用此結構套到個體。例如如果醫學研究的結果是這樣的,那麼我們聽到的醫療訊息將不是「此法成功率 xx%」而是「此法用在此患者身上成功機率估計有 xx%」。