月中,ptt 數學板有一個討論串:
對於x_i均非負數,i=1~n , 試證:
(x_1+x_2+...+x_n)/n ≧ √[(x_1 x_2+x_2 x_3+...+x_n x_1)/n]
這題目有一個更進一步的版本:
(x_1 + x_2 ...+x_n)/n ≧ √[(x_1 x_2+x_2 x_3+...+x_n x_1)/n] ≧ 幾何平均數
不過後者右邊不等式只是算幾不等式應用在 x_1 x_2, ..., x_n x_1 之上而已。我們的問題是
[(x_1+x_2+...+x_n)/n]^2 ≧ (x_1 x_2+x_2 x_3+...+x_n x_1)/n
是否恆成立?
以隨機變數表示,X 是一個有限值域的隨機變數,各值點有相等機率機率 1/n;T 是一個將 X 值域重排的變換,Y = T(X),故 E[Y] = E[X]。上面的問題是說:
如果 X 是正值的,試證:E[X] ≧ √E[XY]
或即 (E[X])^2 ≧ E[XY]。由於 E[Y] = E[X],此式相當於 E[XY] ≦ E[X] E[Y] 或 Cov(X, Y) ≦ 0。因此,在不開根號的情況,"X 是正值的" 條件並無必要。假設一個特例,
x_1 = ... = x_m = 1, x_{m+1} = ... = x_n = 0.
並假設 0 < m < n,則
E[X] = E[Y] = m/n, E[XY] 最大值為 (m-1)/n
當 Y = T(X) 如原問題,將 x_1 映到 x_2, ..., x_n 映到 x_1 時 E[XY] 達到其最大值 (m-1)/n。在這個特例,問題的不等式成立即是說
*(m/n)^2 ≧ (m-1)/n,等同 m^2 ≧ n(m-1)
例如,m = 2 時 n ≦ 4, m = 4 時 n ≦ 5。也就是說:只要 n 夠大,不等式方向將反過來。再看一例,設 x_i = i,故 i < n 時 y_i = i+1 而 y_n = 1。結果
E[X] = E[Y] = (n+1)/2, 而 E[XY] = (n^2 - 1)/3 + 1
故 (E[X])^2 ≧ E[XY] 相當於 n^2 - 6n + 5 ≦ 0, 也就是 n ≦ 4。
限制 X 在值域各點等機率 P[X = x_i] = 1/n 是一個簡化的,合於原問題的假設。先不問原問題的不等式成立與否,如果 P[X = x_i] = p_i 呢?
當 X 的值域僅有 n = 2 個值時,假設 y_1 =T(x_1) = x_2, y_2 = T(x_2) = x_1, 其中 p_1, p_2 非負且其和為 1。則
E[XY] = p_1 x_1 x_2 + p_2 x_2 x_1 = x_1 x_2
E[X]E[Y] = (p_1 x_1 + p_2 x_2)(p_1 x_2 + p_2 x_1)
E[X]E[Y] - E[XY] = p_1 p_2 (x_1 - x_2)^2 ≧ 0
因此 E[XY] ≦ E[X] E[Y],在 p_i 均為 1/2 且 x_i 均非負時 E[Y] = E[X] ≧ √(E[XY]);並且此時 √(E[XY]) 為 x_1, x_2 之幾何平均。但就一般 p_i 而言,E[Y] ≠ E[X],√(x_1 x_2) 也不是機率意義上的幾何平均,後者隨 p_i 的變化而變。也就是說:p_1 ≠ p_2 ≠ 1/2 時,即使在 n = 2 這簡單情形,也不一定成立
E[X] ≧ √E[XY] ≧ e^{E[㏑(X)]}
不過,左邊如果改成 √(E[X]E[Y]) 是沒問題的;而右邊改成 √(g(X) g(Y)), 其中 g(.) 代表幾何平均,則 E[XY] 等於 g(X) 與 g(Y) 之乘積。
但 n = 2 畢竟只是個特例,一般情形,如果隨機變數 X, Y 滿足 E[XY] < E[X] E[Y], 則說 X 與 Y 有負相關;若不等式方向相反,則是正相關;若成立等式,則是零相關。前述 n = 2 的情形,不論 p_1, p_2 大小,只要兩者都是正機率值,Y 與 X 之間就呈現 X 大則 Y 小,X 小則 Y 大的現象,是典型的負相關,因此不等式 E[X] E[Y] ≧ E[XY] 成立;又因只有 x_1, x_2 兩個值,剛好有 E[XY] = g(X) g(Y)。以 n = 3 來看,p_i ≡ 1/3 的情形很容易驗證
(x_1 + x_2 + x_3)^2/9 - (x_1 x_2 + x_2 x_3 + x_3 x_1)/3
= [(x_1 - x_2)^2 + (x_2 - x_3)^2 + (x_3 - x_1)^2]/18
≧ 0
當 n = 4, p_i ≡ 1/4 時,
(x_1 + ... + x_4)^2/16 - (x_1 x_2 + ... + x_4 x_1)/4
= (x_1 - x_2 + x_3 - x_4)^2/16
≧ 0
換言之,問題中的不等式在 n ≦ 4 時是成立的;但 n > 4 時,依前面所舉的例子來看,至少它並不是恆成立。
設 n = 3 但 p_i 不是恆為 1/3,則
E[X] E[Y] - E[XY]
= (p_1 x_1 + p_2 x_2 + p_3 x_3)(p_1 x_2 + p_2 x_3 + p_3 x_1)
- (p_1 x_1 x_2 + p_2 x_2 x_3 + p_3 x_3 x_1)
= (p_1 p_3 x_1^2 + p_2 p_1 x_2^2 + p_3 p_2 x_3^2)
+ (p_1^2 - p_1 + p_2 p_3) x_1 x_2
+ (p_2^2 - p_2 + p_3 p_1) x_2 x_3
+ (p_3^2 - p_3 + p_1 p_2) x_3 x_1
= [(p_1 - p_1^2 - p_2 p_3)/2] (x_1 - x_2)^2
+ [(p_2 - p_2^2 - p_3 p_1)/2] (x_2 - x_3)^2
+ [(p_3 - p_3^2 - p_1 p_2)/2] (x_3 - x_1)^2
以第一項為例,若 p_1 ≒ 0 而 p_2, p_3 接近 1/2, 則 (x_1 - x_2)^2 項的係數是負的,因此,難以直接看出整個值是否非負。用矩陣表示,
E[X] E[Y] - E[XY] = z' A z = x' B x
式中 z' = [ x_1-x_2 x_2-x_3 x_3-x_1 ], x' = [ x_1 x_2 x_3 ],A 是由 (p_1 - p_1^2 - p_2 p_3)/2 等三個係數構成的對角線矩陣,而 B 是下列矩陣
[ p_1 p_3 -(p_1-p_1^2-p_2 p_3)/2 -(p_3-p_3^2-p_1 p_2)/2 ]
[ -(p_1-p_1^2-p_2 p_3)/2 p_1 p_2 -(p_2-p_2^2-p_3 p_1)/2 ]
[ -(p_3-p_3^2-p_1 p_2)/2 -(p_2-p_2^2-p_3 p_1)/2 p_2 p_2 ]
將 z' A z 表示成 x' B x, 由 z 的二次式改成 x 的二次式,因為 z ‵的三個分量不是自由的,x 才是自由的 R^3 向量。E[X] E[Y] - E[XY] 恆非負若且唯若 B 是非負確定 (nonnegative definite)。若 p_i ≡ 1/3 代入,可驗證 B 是一個非負確定矩陣;但設 p_i 分別為 0.1, 0.3, 0.6 代入,則 B 不是非負確定的。
總之,(x_1+x_2+...+x_n)/n ≧ √[(x_1 x_2+x_2 x_3+...+x_n x_1)/n] 並非恆成立,正如 E[XY] 並非恆不大於 E[X] E[Y],即使限制遭 x_i 為正值、遞增也沒有用。倒是
| E[XY] | ≦ √(E[X^2] E[Y^2])
在 p_i = 1/n 時就是
| (x_1 x_2+x_2 x_3+...+x_n x_1)/n | ≦ (x_1^2+...+x_n^2)/n
不過這只是 Cauchy 不等式的射例罷了。
