打字猴:1.701529064e+09
1701529064
1701529065
1701529066 你可能会奇怪,为什么0未包括在内。本福特观察的是以非零数字为首位数的数。所以,7 129 600和0.000 072 002的第一个数字都是7。
1701529067
1701529068 本福特的公式还预测了1~9出现在第二位数、第三位数等所占的比例。在第二位数和第三位数上是有可能出现0的。然而,这些位数上的较小数字在比例上的优势明显比首位数要小得多。出于这个原因,本福特的观察,有时也叫做“首位数现象”。
1701529069
1701529070 本福特的论文题目是《不规则数字定律》(The Law of Anomalous Numbers)。现在,人们几乎称其为“本福特定律”了。事实证明,这并不公平。半个多世纪以前,一位比本福特更有名的科学家——天文学家西蒙·纽康(Simon Newcomb)也曾发现并论述过同一现象。纽康的论文发表在1881年《美国数学杂志》(American Journal of Mathematics)上,他一开篇就提到了如今众所周知的事实:“凡是经常使用对数表的人,一定注意到对数表靠前的篇幅总是比靠后的篇幅磨损得快,从而意识到,10个数字的出现频率并不相同。”
1701529071
1701529072 我想,这进一步证明了提出原创观点很难,而即便是原创观点,也不一定总能得到关注。不知道为什么,纽康的文章很快无人提及,本福特的文章却流传开来。有一种解释说,本福特的文章借助了物理学家汉斯·贝特(Hans Bethe)的一篇重要论文的名声,后者发表在同期《论文集》里,刚好排在本福特文章的后面。
1701529073
1701529074 我们现在知道,本福特定律适用于各种类型的数据,甚至还包括了勤勉的本福特没想要检验的类型。另外,我们还知道,本福特定律并不适用于多种常见的数据,比如电话号码、年龄、体重、社会安全号码、智商、中奖彩票号码和邮政编码等等。
1701529075
1701529076 有数学天分的人或许觉得这一点不言自明。然而,对其他人而言,它显得颇为神秘。为什么本福特定律适用于街道号码(相当适合),但不适用于邮政编码呢?《纽约时报》怎么“知道”人们提到以1为首位数的数字要比提到以9为首位数的数字多6倍呢?
1701529077
1701529078 本福特定律适用于一些表达数量或测量的数目,如城市人口或信用卡付费等。以一种简单直观地解释来说,假设你往投资账户里存入1 000美元,该账户的价值每10年翻一倍。在最初的10年,账户余额的首位数会是1。这笔钱会增长为1 100美元、1 200美元、1 300美元等等,依此类推到1 900美元,直到第一个10年结束时,这笔钱会达到2 000美元。
1701529079
1701529080 这2 000美元需要再过一个10年才能再翻一倍。在此期间,账户余额将从2 000美元攀升到3 000美元再攀升到4 000美元。这意味着,账户余额的首位数会有同样长的10年时间停留在2和3。
1701529081
1701529082 到了第3个10年,账户余额会由4 000美元增长到8 000美元,这期间的首位数将跨越4、5、6和7。接着,到了第4个10年,账户余额将增加到1.6万美元,而这期间的首位数很快就会突破8和9,接下来的大部分时间又回到了1。
1701529083
1701529084 投资价值的首位数在1上停留的时间比2要多,2又比3要多,依此类推。如果你随机抽查账户余额,那么每个数字出现在首位的概率,将恰如本福特推断的分布情况。
1701529085
1701529086 这个世界充满了成倍增长的东西,从细菌菌落到社交网络,无不如此。当然,它们一般不会像我举的例子那样稳定增长,但倘若自然增长让数字分散在若干数量级之内,它们大致上都会遵循本福特分布。如果让黑猩猩反复朝着报纸的财经版扔飞镖,飞镖击中的股价数字也会很好地遵循本福特定律。
1701529087
1701529088 当然,不是所有的测量数值都吻合本福特分布。美国成年男子的体重就是其中一例。很明显,1是最常见的首位数,它的出现概率远远高于本福特定律预测的30%。首位数是6的情况又远远小于本福特分布:不管体重是60~69磅,还是600~699磅,这样的人都不多。
1701529089
1701529090 本福特定律也不适用于电话号码或社会安全号码这样人为规定的号码。作出规定的人差不多会把所有能用的数字都用上。以1为首的号码和以其他任一数字为首的号码同样常见。
1701529091
1701529092 本福特定律提醒我们,数字是我们探讨周遭世界数量的一种人为方式。正如本福特自己所写,他的定律“其实是关于现象和事件的理论,我们却让数字在鲜活事物里扮演了死气沉沉的符号这一可怜的角色”。
1701529093
1701529094 剪刀石头布:如何成为超级预测者 [:1701527500]
1701529095 本福特定律与财务欺诈
1701529096
1701529097 “我想,如果数字确实存在可预测的模式,那么,审计人员或许可以利用这一点来判断数据是真实可信的还是伪造出来的。”马克·尼格里尼说。
1701529098
1701529099 会计师和税务机关很希望能有一套公式来判断哪些数据是真实的,哪些不是。意识到这一点的尼格里尼很快就打定了主意,自己的论文可以探讨如何利用本福特定律来检验财务欺诈。
1701529100
1701529101 他发现,本福特的论文发表之后,有关这一主题的论述很少。唯一一个看出本福特定律实用价值的是经济学家哈尔·范里安(Hal Varian)。1972年,范里安提出用本福特定律来检测政治妄言。他认为,公共决策建立在对成本和效益的精细预测上。这些预测中的数据应吻合本福特分布。否则,它可能暗示预测人员是凭空编造数据或扭曲数据,以求达到政治目的。
1701529102
1701529103 可惜范里安没有进行更进一步的研究,其他人也没有。而这就激起了尼格里尼的热情,尽管他的导师并不鼓励他这么做。“他们更希望你写那种有几十个人都在写的主题。”尼格里尼解释说。但他还是坚持继续研究。直到研究进行了2/3,他才得到了导师们的赞许。4个月之后,他写完了他的毕业论文。
1701529104
1701529105 范里安和尼格里尼的想法很适合用图形来表示。如果你有很多数据,你可以画一幅条形图或柱状图,用以说明每个数字出现在首位的概率。你只需要数一数有多少个数据以1为首,多少个数据以2、3等等为首就可以了。真实的数据符合本福特定律,如图10-1所示。
1701529106
1701529107
1701529108
1701529109
1701529110 图10-1本福特定律
1701529111
1701529112 由首位数概率柱形图形成的这条流畅的曲线,就是本福特定律的视觉形式表现。
1701529113
[ 上一页 ]  [ :1.701529064e+09 ]  [ 下一页 ]