1701529114
范里安和尼格里尼灵光乍现想到的是,伪造数据的人不知道本福特定律。贪污犯或骗税人应该没有理由以为哪个数字的出现频率会比其他数字高。因此,一组虚构的数据或许会表现出首位数平均分布,没有曲线(见图10-2)。
1701529115
1701529116
1701529117
1701529118
1701529119
图10-2首位数数字概率相等的非本福特定律
1701529120
1701529121
当然,这只是个粗略的概念。随机性实验已经证明,伪造的数据几乎从不会平均使用所有数字。阿尔方斯·查帕尼斯也对自己的研究结果做过条形图,它们看起来完全不像是平均分布。
1701529122
1701529123
另一个问题是,真实的财务数据大多完全吻合本福特曲线,可有时候也并非如此。因此,事先判断你面对的是哪一种情况很困难。99美分店的销售数据就是个例子。款项里会包含大量的“9”(因为店里很多小玩意儿都卖99美分)。正如尼格里尼指出,这就能说明价格是人为数目,是人编造出来的营销手段。但如果你管理着一家99美分店,那么,你要面对的现实就是那样,并不意味着有什么欺诈行为。而由于企业性质使得数据的首位数分布与本福特定律不相吻合(理由完全清白),这样的情况还有很多。
1701529124
1701529125
ROCKBREAKSSCISSORS
1701529126
1701529127
超级预测者的思维
1701529128
1701529129
随机性实验已经证明,伪造的数据几乎从不会平均使用所有数字。
1701529130
1701529131
不过,尼格里尼的基本理念是对的:伪造的数据和真实的数据不同。在坚定了自己的这一理念之后,他开始经常跑到辛辛那提法院,寻找跟数据相关的刑事案件。
1701529132
1701529133
超级预测试验
1701529134
1701529135
尼格里尼最初研究的诈骗案件里有一桩来自亚利桑那州。43岁的韦恩·詹姆斯·纳尔逊(Wayne James Nelson)利用自己担任亚利桑那州司库一职搞起了非法侵占的勾当,他以州政府的名义向虚构的供应商开出了一张1 927.48美元的支票。之后的几天,他又伪造了22张假支票,涉案总金额共计近190万美元。
1701529136
1701529137
被捕后,纳尔逊供称,自己开这些假支票是出于好意,想要证明亚利桑那州的应付账款系统存在漏洞。而他只是“忘记”提醒国库其他同事存在这些漏洞,并且把钱转到了自己的账户上。
1701529138
1701529139
乍看起来,纳尔逊开的支票金额(单位:美元)有着一定的模式:
1701529140
1701529141
1701529142
1701529143
1701529144
尼格里尼说,纳尔逊“是反本福特的”。除了两张支票之外,所有金额的首位数都是7、8、9等大数字。纳尔逊把金额控制在10万美元以下,大概是因为他担心6位数的款项会引来不必要的关注。
1701529145
1701529146
图10-3是纳尔逊所开支票金额首位数的直方图。
1701529147
1701529148
1701529149
1701529150
1701529151
图10-3纳尔逊所开支票金额的首位数
1701529152
1701529153
伪造的金额往往是跟合法的金额混杂在一起的。审计员不仅仅会看伪造支票的金额,还会查看纳尔逊或者他所属部门开出的所有支票的金额。即便如此,纳尔逊在伪造金额时对8和9的偏爱,会使8和9为首位数的金额在累积数额中增多,这一点或许是可以检测出来的。
1701529154
1701529155
尼格里尼发现,纳尔逊所开支票的金额还表现出了其他一些伪造数据的典型特征。假设我们只观察支票金额的最后一位数(最靠右的数字),显然它们代表美分,纳尔逊对这些数字没有经济上的兴趣,可它们仍然有规律可循。纳尔逊喜欢以6和7收尾,他完全没用过4(见图10-4)。
1701529156
1701529157
1701529158
1701529159
1701529160
图10-4纳尔逊所开支票金额的末位数
1701529161
1701529162
图10-4看起来很像查帕尼斯所绘的图表。和查帕尼斯实验中的被试一样,纳尔逊不自觉地重复着自己。23张支票的前两位,他分别重复了87、88、93和96,在后两位上重复了16、67和83。
1701529163
[
上一页 ]
[ :1.701529114e+09 ]
[
下一页 ]