打字猴:1.70152908e+09
1701529080 这2 000美元需要再过一个10年才能再翻一倍。在此期间,账户余额将从2 000美元攀升到3 000美元再攀升到4 000美元。这意味着,账户余额的首位数会有同样长的10年时间停留在2和3。
1701529081
1701529082 到了第3个10年,账户余额会由4 000美元增长到8 000美元,这期间的首位数将跨越4、5、6和7。接着,到了第4个10年,账户余额将增加到1.6万美元,而这期间的首位数很快就会突破8和9,接下来的大部分时间又回到了1。
1701529083
1701529084 投资价值的首位数在1上停留的时间比2要多,2又比3要多,依此类推。如果你随机抽查账户余额,那么每个数字出现在首位的概率,将恰如本福特推断的分布情况。
1701529085
1701529086 这个世界充满了成倍增长的东西,从细菌菌落到社交网络,无不如此。当然,它们一般不会像我举的例子那样稳定增长,但倘若自然增长让数字分散在若干数量级之内,它们大致上都会遵循本福特分布。如果让黑猩猩反复朝着报纸的财经版扔飞镖,飞镖击中的股价数字也会很好地遵循本福特定律。
1701529087
1701529088 当然,不是所有的测量数值都吻合本福特分布。美国成年男子的体重就是其中一例。很明显,1是最常见的首位数,它的出现概率远远高于本福特定律预测的30%。首位数是6的情况又远远小于本福特分布:不管体重是60~69磅,还是600~699磅,这样的人都不多。
1701529089
1701529090 本福特定律也不适用于电话号码或社会安全号码这样人为规定的号码。作出规定的人差不多会把所有能用的数字都用上。以1为首的号码和以其他任一数字为首的号码同样常见。
1701529091
1701529092 本福特定律提醒我们,数字是我们探讨周遭世界数量的一种人为方式。正如本福特自己所写,他的定律“其实是关于现象和事件的理论,我们却让数字在鲜活事物里扮演了死气沉沉的符号这一可怜的角色”。
1701529093
1701529094 剪刀石头布:如何成为超级预测者 [:1701527500]
1701529095 本福特定律与财务欺诈
1701529096
1701529097 “我想,如果数字确实存在可预测的模式,那么,审计人员或许可以利用这一点来判断数据是真实可信的还是伪造出来的。”马克·尼格里尼说。
1701529098
1701529099 会计师和税务机关很希望能有一套公式来判断哪些数据是真实的,哪些不是。意识到这一点的尼格里尼很快就打定了主意,自己的论文可以探讨如何利用本福特定律来检验财务欺诈。
1701529100
1701529101 他发现,本福特的论文发表之后,有关这一主题的论述很少。唯一一个看出本福特定律实用价值的是经济学家哈尔·范里安(Hal Varian)。1972年,范里安提出用本福特定律来检测政治妄言。他认为,公共决策建立在对成本和效益的精细预测上。这些预测中的数据应吻合本福特分布。否则,它可能暗示预测人员是凭空编造数据或扭曲数据,以求达到政治目的。
1701529102
1701529103 可惜范里安没有进行更进一步的研究,其他人也没有。而这就激起了尼格里尼的热情,尽管他的导师并不鼓励他这么做。“他们更希望你写那种有几十个人都在写的主题。”尼格里尼解释说。但他还是坚持继续研究。直到研究进行了2/3,他才得到了导师们的赞许。4个月之后,他写完了他的毕业论文。
1701529104
1701529105 范里安和尼格里尼的想法很适合用图形来表示。如果你有很多数据,你可以画一幅条形图或柱状图,用以说明每个数字出现在首位的概率。你只需要数一数有多少个数据以1为首,多少个数据以2、3等等为首就可以了。真实的数据符合本福特定律,如图10-1所示。
1701529106
1701529107
1701529108
1701529109
1701529110 图10-1本福特定律
1701529111
1701529112 由首位数概率柱形图形成的这条流畅的曲线,就是本福特定律的视觉形式表现。
1701529113
1701529114 范里安和尼格里尼灵光乍现想到的是,伪造数据的人不知道本福特定律。贪污犯或骗税人应该没有理由以为哪个数字的出现频率会比其他数字高。因此,一组虚构的数据或许会表现出首位数平均分布,没有曲线(见图10-2)。
1701529115
1701529116
1701529117
1701529118
1701529119 图10-2首位数数字概率相等的非本福特定律
1701529120
1701529121 当然,这只是个粗略的概念。随机性实验已经证明,伪造的数据几乎从不会平均使用所有数字。阿尔方斯·查帕尼斯也对自己的研究结果做过条形图,它们看起来完全不像是平均分布。
1701529122
1701529123 另一个问题是,真实的财务数据大多完全吻合本福特曲线,可有时候也并非如此。因此,事先判断你面对的是哪一种情况很困难。99美分店的销售数据就是个例子。款项里会包含大量的“9”(因为店里很多小玩意儿都卖99美分)。正如尼格里尼指出,这就能说明价格是人为数目,是人编造出来的营销手段。但如果你管理着一家99美分店,那么,你要面对的现实就是那样,并不意味着有什么欺诈行为。而由于企业性质使得数据的首位数分布与本福特定律不相吻合(理由完全清白),这样的情况还有很多。
1701529124
1701529125 ROCKBREAKSSCISSORS
1701529126
1701529127 超级预测者的思维
1701529128
1701529129 随机性实验已经证明,伪造的数据几乎从不会平均使用所有数字。
[ 上一页 ]  [ :1.70152908e+09 ]  [ 下一页 ]