問題引入
「七選五」試題共有5道選擇題,給出7個選項,其中有2項是幹擾項,考生從中選擇5項依次填入每道題中,每題只有一個正確選項,不考慮同一選項被多次選擇的情況。某考生對5道題全部隨機作答,記他答對的題數為 X ,求 X 的分布列與數學期望.
問題初探
首先我們考慮一下期望。這個問題的期望,如果考慮清楚的話,其實並不難計算。我們可以假設該考生每答對1題得1分,設他在第 i(i=1,2,3,4,5) 題中的得分為 M_i ,很容易知道,對於任意給定的 i ,其期望 E(M_i)=\frac17 。根據期望的可加性,我們得到 E(\sum_{i=1}^5M_i)=\sum_{i=1}^5E(M_i)=\frac57 ,也即 X 的期望值。
如果你還沒完全理解,或者無法完全信服,沒有關系,我們繼續往下思考。畢竟,這樣計算未免略顯草率...
漸入佳境
接下來我們考慮分布列。此問題的分布列,乍一看感覺除了亂還是亂。。。畢竟,除了5個正確答案還有倆幹擾項啊,這龐大的樣本量,分類也不是、列舉也不是,該怎麽下手呢??
我們不妨假設正確答案為 ABCDE ,假設該考生答對3題,那麽可以先釘選他答對的3題(假設為 ABCOO ),此時就只需考慮從剩下4個選項中選2個,與 DE 的排列不符合的情況數,最後乘上 C_5^3 即可。
根據這個思路,我們定義一種運算:假定 m 個不同的元素中的 n 個給定元素有一種人為規定的排列方式(即「m選n」),從這 m 個元素中任選 n 個進行排列,記其中恰有 p 個元素處在規定位置的方法數為 W(m,n,p) 。
例如:在假設答案為 ABCDE 的前提下, BCGFA 滿足 m=7,n=5,p=0 ; FBCGA 滿足 m=7,n=5,p=2 ;
W(2,2,1)=0 ; W(2,2,0)=W(2,2,2)=1 ...
根據我們剛才的思路,很容易得到一條運算規則:
\color{red}{W(m,n,p)=C_n^p·W(m-p,n-p,0)}...(1)
同時,經過思考,我們還可以發現:
\color{red}{\sum_{p=0}^nW(m,n,p)=A_m^n}...(2)
\color{red}{W(m,n,n)=1}...(3)
有了這三條運算規則,我們就可以較為清晰地解決這個問題了。假設答案為 ABCDE ,容易知道事件總數為W=A_7^5=2520 。
W(7,5,5)=1
W(7,5,4)=C_5^4W(3,1,0)=C_5^4(A_3^1-W(3,1,1))=10
同時可得 W(3,1,0)=2
W(7,5,3)=C_5^3W(4,2,0)=C_5^3(A_4^2-\sum_{p=1}^2W(4,2,p))=\\C_5^3(A_4^2-C^1_2W(3,1,0)-1)=70
同時可得 W(4,2,0)=7
W(7,5,2)=C_5^2W(5,3,0)=C_5^2(A_5^3-\sum_{p=1}^3W(5,3,p))=\\C_5^2(A_5^3-C_3^1W(4,2,0)-C_3^2W(3,1,0)-C_3^3W(2,0,0))=320
同時可得 W(5,3,0)=32
W(7,5,1)=C_5^1W(6,4,0)=C_5^1(A_6^4-\sum_{p=1}^4W(6,4,p))=\\C_5^1(A_6^4-C_4^1W(5,3,0)-C_4^2W(4,2,0)-C_4^3W(3,1,0)-C_4^4W(2,0,0))=\\905
那麽
W(7,5,0)=A_7^5-\sum_{p=1}^5W(7,5,p)=1214
因此我們得到 X 的分布列
X | 0 | 1 | 2 | 3 | 4 | 5 |
P | 1214/2520 | 905/2520 | 320/2520 | 70/2520 | 10/2520 | 1/2520 |
算一下期望,發現也是 \frac57 !
深入思考
如果是 m 選 n ,期望是不是 \frac{n}m 呢?
根據上面的運算性質,我們可以得到
W(m,n,1)=C_n^1A_{m-1}^{n-1}-\sum_{k=1}^{n-1}C_{k+1}^kW(m,n,k+1)
即 \sum_{k=0}^{n-1}C_{k+1}^kW(m,n,k+1)=C_n^1A_{m-1}^{n-1}=nA_{m-1}^{n-1}
令 j=k+1 ,則 \sum_{j=1}^nC_j^1W(m,n,j)=nA_{m-1}^{n-1}
因此期望 E=\frac{\sum_{j=1}^n(j·W(m,n,j))}{A_m^n}=\frac{nA_{m-1}^{n-1}}{A_m^n}=\frac{n}m
由此可知,「m選n」問題答對題數的期望值為 \frac{n}m 。
拓展延伸
特殊地,當 m=n≥2,p=0 時,即全部錯排時,我們可以根據容斥原理推匯出 錯位全排列公式 ,即
\color{red}{W(n,n,0)=n!\sum_{k=2}^n\frac{(-1)^k}{k!}}
對於此式,如果數據較大計算起來可能略有麻煩,根據 泰勒展開 ,我們可以得到一個估算公式:
\color{red}{W(n,n,0)=[\frac{n!}e+\frac12]}
其中 [x] 表示不大於 x 的最大整數,即對 \frac{n!}e 的計算結果四舍五入,得到的整數就是 W(n,n,0) 了。
詳細的推導過程可參考下面這篇文章: