什么是“本福特定律”?它会让拜登的投票结果白等吗?

什么是“本福特定律”?它会让拜登的投票结果白等吗?

现年77岁高龄的小约瑟夫·罗宾内特·拜登没有白等,在经过选战后疑似已经成为了第46任美国总统。

什么是“本福特定律”?它会让拜登的投票结果白等吗?

然而在投票数据结果出炉后,特朗普团队高调指责拜登选票造假,但无法提供直接证据,有好事者开始用所谓的“本福特定律”检验拜登得票数据的真假。那么什么是“本福特定律”?

本福特定律

举例来理解,统计一下世界上237个国家的人口数量,你觉得其中以1开头的数会占多大比例,而以9开头的数又占多大比例呢?你可能认为是各占1/9,但是事实却不是如此:以1开头的数惊人的占到了27%,而以9开头的数却只占5%。

本福特定律,也称为本福德法则,说明一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,比理论值高出3倍,推广来说,越大的数字,以它为首几位的数出现的机率就越低。

什么是“本福特定律”?它会让拜登的投票结果白等吗?

比如各省市GDP数据符合本福特定律。

在十进制中,首位数字出现的概率为:

什么是“本福特定律”?它会让拜登的投票结果白等吗?

1881年,天文学家西蒙·纽康发现对数表包含以1起首的数那首几页较其他页破烂。可是,亦可以以任何书起首数页也会较破烂这个观点解释。这种情况可能有很多原因导致。

什么是“本福特定律”?它会让拜登的投票结果白等吗?

对数表

1938年,物理学家法兰克·本福特重新发现这个现象,还通过了检验许多数据来证实这种数据高概率出现的奇怪情况。

2009年,西班牙数学家在素数中发现了一种新模式,并且惊讶于为何现在(2009年)才为人发现。虽然素数一般被认为是随机分布的,但西班牙数学家发现素数的数列中每个素数的首位数字有明显的分布规律。

它可以被描述了素数的本福特定律。这项新发现除了提供对素数属性的新洞见之外,还能应用于数据欺骗检测和股票市场分析等领域。

适用范围

这个定律是一个非常神奇的定律,它的适用范围异常的广泛,几乎所有日常生活中没有人为规则的统计数据都满足这个定律。比如说世界各国人口数量、各国国土面积、账本、物理化学常数、数学物理课本后面的答案、放射性半衰期等等数据居然都符合本福特定律。值得一提的是,科学家还发现,统计物理的三个重要分布,Boltzmann-Gibbs分布,Bose-Einstein分布,Fermi-Dirac分布,也基本上满足Benford定律!

数据真伪

之后人们又去研究了更多的数据类型,发现了满足本福特定律的数据必须是不能按照规律排列的,比如身份证号码,发票编号,;同时数据也不能经过人工干预,如果经过人工干预的数据,就很难再符合本福特定律。因此这一条也成为鉴别账目数据是否经过人工改造的有利工具,历史上也有过很多次通过本福特定律查出数据造假。

什么是“本福特定律”?它会让拜登的投票结果白等吗?

审计学家依据这一定律发现了2004年美国总统选举中佛罗里达州的投票欺诈行为,2004年委内瑞拉的投票欺诈和2006年墨西哥投票欺诈。2001年,美国最大的能源交易商安然公司宣布破产,当时传出了该公司高层管理人员涉嫌做假账的传闻。事后人们发现,安然公司在2001年到2002年所公布的每股盈利数字就不符合本福特定律,这证明了安然的高层领导确实改动过这些数据。

什么是“本福特定律”?它会让拜登的投票结果白等吗?

因此认为拜登投票数据存在舞弊就搬出了“本福特定律” 来说事。

为什么会出现这种现象?

一种大众化的解释是,从数数目来说,顺序从1开始数,1,2,3,…,9,从这点终结的话,所有数起首的机会似乎相同,但9之后的两位数10至19,以1起首的数又大大抛离了其他数了。而下一堆9起首的数出现之前,必然会经过一堆以2,3,4,…,8起首的数。若果这样数法有个终结点,以1起首的数的出现率一般都比9大。

就以一个城市的所有门牌号为例,有的街道门牌号可能在100多就结束了,有的在500多结束,有的在900多结束。注意到500多结束那条街一定包含了1、10+和100~199这些1开头的门牌号,而不包含9开头的百位数,只包含9及90+的以9开头的数,这样一来明显以1打头的就多于9打头的了。然后对整个城市的所有街道做一个综合,最终就满足本福特定律了。

什么是“本福特定律”?它会让拜登的投票结果白等吗?

从数理来看,本福特定律产生的根源,就在于指数增长。这幅图可以直观的显示,如果一个变量随时间成指数增长的话,那么这个变量开头的数字随着时间的变化就应该是如上图:(横轴代表时间,纵轴代表那个变量)

显然,在某时刻你得到它以1开头的概率要大于9开头。而这是只取一个值的情况,如果是取大量的数据的话,在某时刻你观察到他以1开头的数据数量就大于以9开头的数量了。而指数增长的形式在自然界是十分普遍的,只要一个变量的增长率和他的大小成正比,结果就会是指数增长。比如说人类科技发展的速度大致和已有的科技成果成正比,所以人类的科技发展就是个指数增长;人口增长率会和已存在人口数成正比,因此没有资源限制的人口增长也是指数增长。指数增长是自然中极为普遍的一种变化规律,而这种变化规律可以直接导致本福特定律。

梵观点:玩数字游戏可能也改变不了什么现实,川普在任的几年的确表现不咋地。


分享到:


相關文章: