1701529044
如果你让人们在1~10之间选择一个数字,大多数人往往会选7。这会扭曲焦点小组的评分和大众点评式网络评价。
1701529045
1701529046
对产品给出满分(10分制里的10分,5星制里的5星)的评分者所占比例,或许比平均得分更能准确地衡量产品的销售潜力。
1701529047
1701529049
10 神秘的本福特定律
1701529050
1701529051
在南非开普敦长大的马克·尼格里尼(Mark Nigrini)对于数字的魔力相当着迷。他到美国求学,希望能够在那里拿到会计学博士学位。1989年4月,即将毕业的他正在寻找论文的研究主题。在辛辛那提大学的某一天,他偶然看到一篇简报,其中提到了“本福特定律”(Benford’s law)这一概念。“当晚,我就去了图书馆,找到了本福特的论文。”尼格里尼回忆说。他的职业生涯因为读了这篇论文而发生了改变。
1701529052
1701529053
20世纪20年代,物理学家弗兰克·本福特(Frank Benford)为纽约州斯克内克塔迪市的通用电气公司效力。当时,科学计算的意思就是翻查对数表,检索数据。本福特注意到,对数表的前几页因为长时间使用而被磨损得厉害,后面几页却几乎是全新的。这个无聊时发现的现象而非通用电气公司付钱让他从事的工作,让本福特的名字流传到了后世。
1701529054
1701529055
本福特需要查询的数值往往以较小的数字为首位数,而以较小数字为首位数的数值则处在对数表靠前的篇幅。举例来说,本福特发现,科学研究和工程设计中遇到的数据有30%左右都以1为首位数。与此相对应的,仅有5%的数据以9为首位数。这样一来,对数表靠后的篇幅自然就相对没什么人使用了。
1701529056
1701529057
本福特把他的这个发现告诉了通用电气公司的化学家欧文·朗缪尔(Irving Langmuir)。日后成为诺贝尔奖得主的朗缪尔鼓励他发表一篇相关的论文。此后10年,本福特有条不紊地探索着这一说不清道不明的现象。他发现,这一现象并不为科学数字所独有。他测算了棒球统计数据的首位数字,也发现了相同的分布。他把一本《读者文摘》(Reader’s Digest)里提到的每一个数字都记录下来,发现网球得分、股票报价、河流的长度、原子量、所罗门群岛的电费单以及《纽约时报》头版上提到的数据等等,全都有着相同的模式。这简直就像是一套阴谋论,一切都有联系。
1701529058
1701529059
最终,本福特在1938年的一期《美国哲学学会论文集》(Proceedings of the American Philosophical Society)中发表了自己的结论。文中,他推导出一套精确的公式来计算1~9出现在首位数所占的比例(见表10-1)。
1701529060
1701529061
表10-1 1~9为首位数所占比例
1701529062
1701529063
1701529064
1701529065
1701529066
你可能会奇怪,为什么0未包括在内。本福特观察的是以非零数字为首位数的数。所以,7 129 600和0.000 072 002的第一个数字都是7。
1701529067
1701529068
本福特的公式还预测了1~9出现在第二位数、第三位数等所占的比例。在第二位数和第三位数上是有可能出现0的。然而,这些位数上的较小数字在比例上的优势明显比首位数要小得多。出于这个原因,本福特的观察,有时也叫做“首位数现象”。
1701529069
1701529070
本福特的论文题目是《不规则数字定律》(The Law of Anomalous Numbers)。现在,人们几乎称其为“本福特定律”了。事实证明,这并不公平。半个多世纪以前,一位比本福特更有名的科学家——天文学家西蒙·纽康(Simon Newcomb)也曾发现并论述过同一现象。纽康的论文发表在1881年《美国数学杂志》(American Journal of Mathematics)上,他一开篇就提到了如今众所周知的事实:“凡是经常使用对数表的人,一定注意到对数表靠前的篇幅总是比靠后的篇幅磨损得快,从而意识到,10个数字的出现频率并不相同。”
1701529071
1701529072
我想,这进一步证明了提出原创观点很难,而即便是原创观点,也不一定总能得到关注。不知道为什么,纽康的文章很快无人提及,本福特的文章却流传开来。有一种解释说,本福特的文章借助了物理学家汉斯·贝特(Hans Bethe)的一篇重要论文的名声,后者发表在同期《论文集》里,刚好排在本福特文章的后面。
1701529073
1701529074
我们现在知道,本福特定律适用于各种类型的数据,甚至还包括了勤勉的本福特没想要检验的类型。另外,我们还知道,本福特定律并不适用于多种常见的数据,比如电话号码、年龄、体重、社会安全号码、智商、中奖彩票号码和邮政编码等等。
1701529075
1701529076
有数学天分的人或许觉得这一点不言自明。然而,对其他人而言,它显得颇为神秘。为什么本福特定律适用于街道号码(相当适合),但不适用于邮政编码呢?《纽约时报》怎么“知道”人们提到以1为首位数的数字要比提到以9为首位数的数字多6倍呢?
1701529077
1701529078
本福特定律适用于一些表达数量或测量的数目,如城市人口或信用卡付费等。以一种简单直观地解释来说,假设你往投资账户里存入1 000美元,该账户的价值每10年翻一倍。在最初的10年,账户余额的首位数会是1。这笔钱会增长为1 100美元、1 200美元、1 300美元等等,依此类推到1 900美元,直到第一个10年结束时,这笔钱会达到2 000美元。
1701529079
1701529080
这2 000美元需要再过一个10年才能再翻一倍。在此期间,账户余额将从2 000美元攀升到3 000美元再攀升到4 000美元。这意味着,账户余额的首位数会有同样长的10年时间停留在2和3。
1701529081
1701529082
到了第3个10年,账户余额会由4 000美元增长到8 000美元,这期间的首位数将跨越4、5、6和7。接着,到了第4个10年,账户余额将增加到1.6万美元,而这期间的首位数很快就会突破8和9,接下来的大部分时间又回到了1。
1701529083
1701529084
投资价值的首位数在1上停留的时间比2要多,2又比3要多,依此类推。如果你随机抽查账户余额,那么每个数字出现在首位的概率,将恰如本福特推断的分布情况。
1701529085
1701529086
这个世界充满了成倍增长的东西,从细菌菌落到社交网络,无不如此。当然,它们一般不会像我举的例子那样稳定增长,但倘若自然增长让数字分散在若干数量级之内,它们大致上都会遵循本福特分布。如果让黑猩猩反复朝着报纸的财经版扔飞镖,飞镖击中的股价数字也会很好地遵循本福特定律。
1701529087
1701529088
当然,不是所有的测量数值都吻合本福特分布。美国成年男子的体重就是其中一例。很明显,1是最常见的首位数,它的出现概率远远高于本福特定律预测的30%。首位数是6的情况又远远小于本福特分布:不管体重是60~69磅,还是600~699磅,这样的人都不多。
1701529089
1701529090
本福特定律也不适用于电话号码或社会安全号码这样人为规定的号码。作出规定的人差不多会把所有能用的数字都用上。以1为首的号码和以其他任一数字为首的号码同样常见。
1701529091
1701529092
本福特定律提醒我们,数字是我们探讨周遭世界数量的一种人为方式。正如本福特自己所写,他的定律“其实是关于现象和事件的理论,我们却让数字在鲜活事物里扮演了死气沉沉的符号这一可怜的角色”。
1701529093
[
上一页 ]
[ :1.701529044e+09 ]
[
下一页 ]