Regression, 回歸,這名詞在統計上使用最早大概是 Francis Galton 於 19 世紀用來描述一種生物學現象:高大祖先的後代趨向正常平均數,這種現象,也稱 regression toward the mean (回歸均值), reversion to the mean (回轉均值)或 reversion to mediocrity (回轉平庸)。Galton 原意只是生物學現象的描述,闡述父母的極端特徹,並沒有完全傳遞給他們的後代。略過 Galton 在生物遺傳學上的錯誤解釋不論,其實回歸的現象只是一個統計或更直接地說是機率現象,也和中央極限定理有些關係。
為何說是一種統計或機率現象?像身高體重以及許多自然的及社會的現象,大都是中間高兩端低的所謂單峰型分布。在 Galton 關於父子身高的分析中,被注意到的父親身高特高的部分,可以說是偏向有較高身高基因的,但又不全是,有些基因屬較低身高的右邊極端值被歸入;又有些基因屬較高身高的左邊極端值被捨去。因此,這些身高極高的父親的基因並不純粹基因屬較高身高的。再者,即使基因屬較高身高的,其身高當是一個單峰分布。而對這些樣本,父親身高只是這個分布偏高的那一部分;子輩卻是觀察整個分布。一個分布只取較高部分,其平均值當然高於整個分布的平均值:
E[ X | X > c ] > E[ X ]