月中,ptt 數學板有一個討論串:

對於x_i均非負數,i=1~n , 試證:
        (x_1+x_2+...+x_n)/n ≧ √[(x_1 x_2+x_2 x_3+...+x_n x_1)/n]

這題目有一個更進一步的版本:

(x_1 + x_2 ...+x_n)/n ≧ √[(x_1 x_2+x_2 x_3+...+x_n x_1)/n] ≧ 幾何平均數

不過後者右邊不等式只是算幾不等式應用在 x_1 x_2, ..., x_n x_1 之上而已。我們的問題是

   [(x_1+x_2+...+x_n)/n]^2 ≧ (x_1 x_2+x_2 x_3+...+x_n x_1)/n

是否恆成立?

以隨機變數表示,X 是一個有限值域的隨機變數,各值點有相等機率機率 1/n;T 是一個將 X 值域重排的變換,Y = T(X),故 E[Y] = E[X]。上面的問題是說:

如果 X 是正值的,試證:E[X] ≧ √E[XY] 

或即 (E[X])^2 ≧ E[XY]。由於 E[Y] = E[X],此式相當於 E[XY] ≦ E[X] E[Y] 或 Cov(X, Y) ≦ 0。因此,在不開根號的情況,"X 是正值的" 條件並無必要。假設一個特例,

x_1 = ... = x_m = 1,  x_{m+1} = ... = x_n = 0.

並假設 0 < m < n,則

E[X] = E[Y] = m/n,  E[XY] 最大值為 (m-1)/n

當 Y = T(X) 如原問題,將 x_1 映到 x_2, ..., x_n 映到 x_1 時 E[XY] 達到其最大值 (m-1)/n。在這個特例,問題的不等式成立即是說

*(m/n)^2 ≧ (m-1)/n,等同 m^2 ≧ n(m-1)

例如,m = 2 時 n ≦ 4, m = 4 時 n ≦ 5。也就是說:只要 n 夠大,不等式方向將反過來。再看一例,設 x_i = i,故 i < n 時 y_i = i+1 而 y_n = 1。結果

E[X] = E[Y] = (n+1)/2, 而 E[XY] = (n^2 - 1)/3 + 1

故 (E[X])^2 ≧ E[XY] 相當於 n^2 - 6n + 5 ≦ 0, 也就是 n ≦ 4。

限制 X 在值域各點等機率 P[X = x_i] = 1/n 是一個簡化的,合於原問題的假設。先不問原問題的不等式成立與否,如果 P[X = x_i] = p_i 呢?

當 X 的值域僅有 n = 2 個值時,假設 y_1 =T(x_1) = x_2, y_2 = T(x_2) = x_1, 其中 p_1, p_2 非負且其和為 1。則

E[XY] = p_1 x_1 x_2 + p_2 x_2 x_1 = x_1 x_2
E[X]E[Y] = (p_1 x_1 + p_2 x_2)(p_1 x_2 + p_2 x_1)
E[X]E[Y] - E[XY] = p_1 p_2 (x_1 - x_2)^2 ≧ 0

因此 E[XY] ≦ E[X] E[Y],在 p_i 均為 1/2 且 x_i 均非負時 E[Y] = E[X] ≧ √(E[XY]);並且此時 √(E[XY]) 為 x_1, x_2 之幾何平均。但就一般 p_i 而言,E[Y] ≠ E[X],√(x_1 x_2) 也不是機率意義上的幾何平均,後者隨 p_i 的變化而變。也就是說:p_1 ≠ p_2 ≠ 1/2 時,即使在 n = 2 這簡單情形,也不一定成立

E[X] ≧ √E[XY] ≧ e^{E[㏑(X)]}

不過,左邊如果改成 √(E[X]E[Y]) 是沒問題的;而右邊改成 √(g(X) g(Y)), 其中 g(.) 代表幾何平均,則 E[XY] 等於 g(X) 與 g(Y) 之乘積。

但 n = 2 畢竟只是個特例,一般情形,如果隨機變數 X, Y 滿足 E[XY] < E[X] E[Y], 則說 X 與 Y 有負相關;若不等式方向相反,則是正相關;若成立等式,則是零相關。前述 n = 2 的情形,不論 p_1, p_2 大小,只要兩者都是正機率值,Y 與 X 之間就呈現 X 大則 Y 小,X 小則 Y 大的現象,是典型的負相關,因此不等式 E[X] E[Y] ≧ E[XY] 成立;又因只有 x_1, x_2 兩個值,剛好有 E[XY] = g(X) g(Y)。以 n = 3 來看,p_i ≡ 1/3 的情形很容易驗證

(x_1 + x_2 + x_3)^2/9 - (x_1 x_2 + x_2 x_3 + x_3 x_1)/3
      = [(x_1 - x_2)^2 + (x_2 - x_3)^2 + (x_3 - x_1)^2]/18
      ≧ 0

當 n = 4, p_i ≡ 1/4 時,

(x_1 + ... + x_4)^2/16 - (x_1 x_2 + ... + x_4 x_1)/4
      = (x_1 - x_2 + x_3 - x_4)^2/16
      ≧ 0

換言之,問題中的不等式在 n ≦ 4 時是成立的;但 n > 4 時,依前面所舉的例子來看,至少它並不是恆成立。

設 n = 3 但 p_i 不是恆為 1/3,則

E[X] E[Y] - E[XY]
   = (p_1 x_1 + p_2 x_2 + p_3 x_3)(p_1 x_2 + p_2 x_3 + p_3 x_1)
                       - (p_1 x_1 x_2 + p_2 x_2 x_3 + p_3 x_3 x_1)
   = (p_1 p_3 x_1^2 + p_2 p_1 x_2^2 + p_3 p_2 x_3^2)
                       + (p_1^2 - p_1 + p_2 p_3) x_1 x_2
                       + (p_2^2 - p_2 + p_3 p_1) x_2 x_3
                       + (p_3^2 - p_3 + p_1 p_2) x_3 x_1
   = [(p_1 - p_1^2 - p_2 p_3)/2] (x_1 - x_2)^2
           + [(p_2 - p_2^2 - p_3 p_1)/2] (x_2 - x_3)^2
           + [(p_3 - p_3^2 - p_1 p_2)/2] (x_3 - x_1)^2

以第一項為例,若 p_1 ≒ 0 而 p_2, p_3 接近 1/2, 則 (x_1 - x_2)^2 項的係數是負的,因此,難以直接看出整個值是否非負。用矩陣表示,

E[X] E[Y] - E[XY] = z' A z = x' B x

式中 z' = [ x_1-x_2  x_2-x_3  x_3-x_1 ], x' = [ x_1  x_2  x_3 ],A 是由 (p_1 - p_1^2 - p_2 p_3)/2 等三個係數構成的對角線矩陣,而 B 是下列矩陣

[       p_1 p_3            -(p_1-p_1^2-p_2 p_3)/2  -(p_3-p_3^2-p_1 p_2)/2 ]
[ -(p_1-p_1^2-p_2 p_3)/2        p_1 p_2            -(p_2-p_2^2-p_3 p_1)/2 ]
[ -(p_3-p_3^2-p_1 p_2)/2  -(p_2-p_2^2-p_3 p_1)/2       p_2 p_2            ]

z' A z 表示成 x' B x, 由 z 的二次式改成 x 的二次式,因為 z ‵的三個分量不是自由的,x 才是自由的 R^3 向量。E[X] E[Y] - E[XY] 恆非負若且唯若 B 是非負確定 (nonnegative definite)。若 p_i ≡ 1/3 代入,可驗證 B 是一個非負確定矩陣;但設 p_i 分別為 0.1, 0.3, 0.6 代入,則 B 不是非負確定的。

總之,(x_1+x_2+...+x_n)/n ≧ √[(x_1 x_2+x_2 x_3+...+x_n x_1)/n] 並非恆成立,正如 E[XY] 並非恆不大於 E[X] E[Y],即使限制遭 x_i 為正值、遞增也沒有用。倒是

| E[XY] | ≦ √(E[X^2] E[Y^2])

在 p_i = 1/n 時就是

| (x_1 x_2+x_2 x_3+...+x_n x_1)/n | ≦ (x_1^2+...+x_n^2)/n

不過這只是 Cauchy 不等式的射例罷了。

文章標籤
全站熱搜
創作者介紹
創作者 等死的老賊 的頭像
等死的老賊

劉應興的部落格

等死的老賊 發表在 痞客邦 留言(0) 人氣(2)