排容原理 (inclusion-exclusion principle) 是關於 n 個集合之聯集 ∪_{i=1~n} A(i) 的「量度」計算公式:
| ∪_{i=1~n} A(i) | = Σ |A(i)| - Σ |A(i)∩A(j)| + Σ |A(i)∩A(j)∩A(k)| - …
其中「量度」可以是有限集的元素個數、事件機率、或可測集的測度 (measure),包括直線上有界子集的長度、平面上有界子集的面積、或一般的有限測度。
有限集的元素個數可以說是在有限樣本空間上的計數測度 (counting measure);機率是一個特殊的有限測度,使樣本空間的測度值為 1;長度與面積分別是一維與二維的 Lebesgue 測度。所以,前項「量度」完全可以用「測度」取代,即
μ(∪_{i=1~n} A(i)) = Σ μ(A(i)) - Σ μ(A(i)∩A(j)) + Σ μ(A(i)∩A(j)∩A(k)) - …
若是機率,則用 P(.) 取代 μ(.)。事件 A 的機率可以用指示函數 (indicator function) I_A(ω) 的期望值 E[I_A] 來表示,一般(有限)測度 μ(A) 也可用 I_A 在整個樣本空間 Ω 上的積分來表示
μ(A) = ∫_A 1 dμ{ω} = ∫_Ω I_A(ω) dμ{ω}, P(A) = E[I_A] = ∫_Ω I_A(ω) dP{ω}
因此,除了機率可以用指示函數的期望值表示以外,一般有限測度也可以用指示函數的積分表示,而期望值也是積分,其性質相同。再者,任何有限測度可以簡單地轉成機率
P(A) = μ(A)/μ(Ω)
由於 μ(Ω) 是一個常數,因此機率形式的結果通常可以直接適用於一般有限測度。所以,不失一般性,要討論前述「排容原理」, 考慮機率形式的原理即可。
排容原理的基本型是
μ(A∪B) = μ(A) + μ(B) - μ(A∩B), P(A∪B) = P(A) + P(B) - P(A∩B)
它來自機率或一般測度的基本公設:相加性 (additivity)
有限相加性:A, B 互斥,則 μ(A∪B) = μ(A) + μ(B)
可數相加性:A(i), i = 1, 2, ... 兩兩互斥,則 μ(∪ A(i)) = Σ μ(A(i))
這裡只需有限梳加性 (finite additivity),,它顯然比機率或一般測度的可數相加性 (countable additivity) 公設弱些,但已夠用。由
A∪B = A ∪ (B∩A'), B = (B∩A) ∪ (B∩A')
其中 A' 表示 A 的補集,即 A' = Ω - A.。故由相加性,
P(A∪B) = P(A) + P(B∩A')
= P{A) + (P(B) - P(B∩A))
= P(A) + P(B) - P(A∩B)
也就是說,當 n = 2 時,排容原理成立。接下來可以用數學歸納法,假設 2 ≦ n ≦ k 時排容原理都成立,當 n = k+1 時
P{∪_{i=1~n} A(i)) = P((∪_{i=1~k} A(i)) ∪ A(n)) -
= P(∪_{i=1~k} A(i)) + P(A(n)) - P((∪_{i=1~k} A(i)) ∩ A(n))
= Σ_{i=1~k} P(A(i)) + P(A(n))
- Σ_{1≦i≦j≦k} P{A(i)∩A(j))
+ Σ_{1≦i≦j≦h≦k} P{A(i)∩A(j)∩A(h)) - …
- Σ_{1≦i≦k} P{A(i)∩A(n)) + Σ_{1≦i≦j≦k} P{A(i)∩A(j)∩A(n)) - …
= Σ_{i=1~n} P(A(i)) - Σ_{1≦i≦j≦n} P{A(i)∩A(j))
+ Σ_{1≦i≦j≦h≦n} P{A(i)∩A(j)∩A(h)) - …
也就是說 n = k+1 時排容原理也成立。因此,依數學歸納法原理,n 是 2 以上的正整數時,排容原理都成立。
如前面說的,測度或機率可以用指示函數的積分或期望值表示,因此排容原理有用指示函數版本:
I_{∪ A(i)} = Σ I_{A(i)} - ΣΣ I_{A(i)∩A(j)} +- …
由於指示函數兩個基本性質:
I_{A'}(ω)= 1 - I_A(ω), I_{A∩B} = I_A I_B
j故
I_{∪ A(i)} = 1 - I_{(∪ A(i)}' = 1 - I_{∩ A(i)'}
= 1 - Π (1 - I_{A(i)})
= Σ I_{A(i)} - ΣΣ I_{A(i)∩A(j)} +- …
單純的 1 - Π_ i (1 - Ui) 的代數展開式而已。
