如何用排列組合計算英語七選五全蒙錯的概率？

2020-05-23知識

問題引入

「七選五」試題共有5道選擇題，給出7個選項，其中有2項是幹擾項，考生從中選擇5項依次填入每道題中，每題只有一個正確選項，不考慮同一選項被多次選擇的情況。某考生對5道題全部隨機作答，記他答對的題數為 X ，求 X 的分布列與數學期望.

問題初探

首先我們考慮一下期望。這個問題的期望，如果考慮清楚的話，其實並不難計算。我們可以假設該考生每答對1題得1分，設他在第 i(i=1,2,3,4,5) 題中的得分為 M_i ，很容易知道，對於任意給定的 i ，其期望 E(M_i)=\frac17 。根據期望的可加性，我們得到 E(\sum_{i=1}^5M_i)=\sum_{i=1}^5E(M_i)=\frac57 ，也即 X 的期望值。

如果你還沒完全理解，或者無法完全信服，沒有關系，我們繼續往下思考。畢竟，這樣計算未免略顯草率...

漸入佳境

接下來我們考慮分布列。此問題的分布列，乍一看感覺除了亂還是亂。。。畢竟，除了5個正確答案還有倆幹擾項啊，這龐大的樣本量，分類也不是、列舉也不是，該怎麽下手呢？？

我們不妨假設正確答案為 ABCDE ，假設該考生答對3題，那麽可以先釘選他答對的3題（假設為 ABCOO ），此時就只需考慮從剩下4個選項中選2個，與 DE 的排列不符合的情況數，最後乘上 C_5^3 即可。

根據這個思路，我們定義一種運算：假定 m 個不同的元素中的 n 個給定元素有一種人為規定的排列方式（即「m選n」），從這 m 個元素中任選 n 個進行排列，記其中恰有 p 個元素處在規定位置的方法數為 W(m,n,p) 。

例如：在假設答案為 ABCDE 的前提下， BCGFA 滿足 m=7,n=5,p=0 ； FBCGA 滿足 m=7,n=5,p=2 ；

W(2,2,1)=0 ； W(2,2,0)=W(2,2,2)=1 ...

根據我們剛才的思路，很容易得到一條運算規則：

\color{red}{W(m,n,p)=C_n^p·W(m-p,n-p,0)}...(1)

同時，經過思考，我們還可以發現：

\color{red}{\sum_{p=0}^nW(m,n,p)=A_m^n}...(2)

\color{red}{W(m,n,n)=1}...(3)

有了這三條運算規則，我們就可以較為清晰地解決這個問題了。假設答案為 ABCDE ，容易知道事件總數為W=A_7^5=2520 。

W(7,5,5)=1

W(7,5,4)=C_5^4W(3,1,0)=C_5^4(A_3^1-W(3,1,1))=10

同時可得 W(3,1,0)=2

W(7,5,3)=C_5^3W(4,2,0)=C_5^3(A_4^2-\sum_{p=1}^2W(4,2,p))=\\C_5^3(A_4^2-C^1_2W(3,1,0)-1)=70

同時可得 W(4,2,0)=7

W(7,5,2)=C_5^2W(5,3,0)=C_5^2(A_5^3-\sum_{p=1}^3W(5,3,p))=\\C_5^2(A_5^3-C_3^1W(4,2,0)-C_3^2W(3,1,0)-C_3^3W(2,0,0))=320

同時可得 W(5,3,0)=32

W(7,5,1)=C_5^1W(6,4,0)=C_5^1(A_6^4-\sum_{p=1}^4W(6,4,p))=\\C_5^1(A_6^4-C_4^1W(5,3,0)-C_4^2W(4,2,0)-C_4^3W(3,1,0)-C_4^4W(2,0,0))=\\905

那麽

W(7,5,0)=A_7^5-\sum_{p=1}^5W(7,5,p)=1214

因此我們得到 X 的分布列

X	0	1	2	3	4	5
P	1214/2520	905/2520	320/2520	70/2520	10/2520	1/2520

算一下期望，發現也是 \frac57 ！

深入思考

如果是 m 選 n ，期望是不是 \frac{n}m 呢？

根據上面的運算性質，我們可以得到

W(m,n,1)=C_n^1A_{m-1}^{n-1}-\sum_{k=1}^{n-1}C_{k+1}^kW(m,n,k+1)

即 \sum_{k=0}^{n-1}C_{k+1}^kW(m,n,k+1)=C_n^1A_{m-1}^{n-1}=nA_{m-1}^{n-1}

令 j=k+1 ，則 \sum_{j=1}^nC_j^1W(m,n,j)=nA_{m-1}^{n-1}

因此期望 E=\frac{\sum_{j=1}^n(j·W(m,n,j))}{A_m^n}=\frac{nA_{m-1}^{n-1}}{A_m^n}=\frac{n}m

由此可知，「m選n」問題答對題數的期望值為 \frac{n}m 。

拓展延伸

特殊地，當 m=n≥2,p=0 時，即全部錯排時，我們可以根據容斥原理推匯出 錯位全排列公式 ，即

\color{red}{W(n,n,0)=n!\sum_{k=2}^n\frac{(-1)^k}{k!}}

對於此式，如果數據較大計算起來可能略有麻煩，根據 泰勒展開 ，我們可以得到一個估算公式：

\color{red}{W(n,n,0)=[\frac{n!}e+\frac12]}

其中 [x] 表示不大於 x 的最大整數，即對 \frac{n!}e 的計算結果四舍五入，得到的整數就是 W(n,n,0) 了。

詳細的推導過程可參考下面這篇文章：