在实际生活中随机找一个数,这个数是1开头的概率是多少呢?
正常人的回答估计都是1/9,我的第一反应也是1/9
但实际上这个概率是lg2,约为30.1%
我后面的反应是 怎么会这么高?数学是不是又在搞什么故弄玄虚?
但它确实是这样
这就是首位数定律,也叫本福特定律
它的数学表述为:在b进位制中,以数n起头的数出现的机率为 log_b(n+1)-log_bn
在十进制中首位数出现的概率分别为:
1,30.1%
2,17.6%
3,12.5%
4,9.7%
5,7.9%
6,6.7%
7,5.8%
8,5.1%
9,4.6%
简单的解释是:从1数到10, 1 2 3 4 …… 10,以1开头的数字有2个,概率20%
从1数到20,1 2 3 …… 10 11 12 ……20,以1开头的数字有11个,概率55%
从1数到30,1 2 3 …… 30,以1开头的数字有11个,概率36.7%
……
从1数到100,以1开头的数字有12个,概率12%
……
法兰克·本福特通过计算得出以1开头的数字出现的概率为lg2,并总结出了上述规律。
严格的证明参见Hill, T. P. "A Statistical Derivation of the Significant-Digit Law." Stat. Sci. 10, 354-363, 1996.
它的适用范围异常的广泛,几乎所有日常生活中没有人为规则的统计数据都满足这个定律。比如说世界各国人口数量、各国国土面积、账本、物理化学常数、数学物理课本后面的答案、放射性半衰期等等。统计物理中的三个重要分布,Boltzmann-Gibbs分布,Bose-Einstein分布,Fermi-Dirac分布,也基本上满足这个定律。
这个定律有什么用呢?
一个非常著名的案例就是安然公司的造假案。2001年,美国最大的能源交易商安然公司宣布破产,并传出公司高层管理人员涉嫌做假账的传闻。据说安然高层改动过财务数据,因为他们所公布的2001-2002年每股盈利数据不符合本福特定律。
![](https://img.jasve.com/2024-2/403d2660eeb1ad2b04f9987f7dc83c5f.webp)
所以以后你们改实验数据、报假账什么的都要当心了
![](https://img.jasve.com/2024-2/d168c5a111d4be8454586ccb2cc4481a.webp)