在實際生活中隨機找一個數,這個數是1開頭的機率是多少呢?
正常人的回答估計都是1/9,我的第一反應也是1/9
但實際上這個機率是lg2,約為30.1%
我後面的反應是 怎麽會這麽高?數學是不是又在搞什麽故弄玄虛?
但它確實是這樣
這就是首位數定律,也叫本福特定律
它的數學表述為:在b進位制中,以數n起頭的數出現的機率為 log_b(n+1)-log_bn
在十進制中首位數出現的機率分別為:
1,30.1%
2,17.6%
3,12.5%
4,9.7%
5,7.9%
6,6.7%
7,5.8%
8,5.1%
9,4.6%
簡單的解釋是:從1數到10, 1 2 3 4 …… 10,以1開頭的數位有2個,機率20%
從1數到20,1 2 3 …… 10 11 12 ……20,以1開頭的數位有11個,機率55%
從1數到30,1 2 3 …… 30,以1開頭的數位有11個,機率36.7%
……
從1數到100,以1開頭的數位有12個,機率12%
……
法蘭克·本福特透過計算得出以1開頭的數位出現的機率為lg2,並總結出了上述規律。
嚴格的證明參見Hill, T. P. "A Statistical Derivation of the Significant-Digit Law." Stat. Sci. 10, 354-363, 1996.
它的適用範圍異常的廣泛,幾乎所有日常生活中沒有人為規則的統計數據都滿足這個定律。比如說世界各國人口數量、各國國土面積、賬本、物理化學常數、數學物理課本後面的答案、放射性半衰期等等。統計物理中的三個重要分布,Boltzmann-Gibbs分布,Bose-Einstein分布,Fermi-Dirac分布,也基本上滿足這個定律。
這個定律有什麽用呢?
一個非常著名的案例就是安然公司的造假案。2001年,美國最大的能源交易商安然公司宣布破產,並傳出公司高層管理人員涉嫌做假賬的傳聞。據說安然高層改動過財務數據,因為他們所公布的2001-2002年每股盈利數據不符合本福特定律。
所以以後你們改實驗數據、報假賬什麽的都要當心了