打字猴:1.70395808e+09
1703958080 当宋朝明忙于测算每个手机用户的熵时,我们已经发现人类的活动遵循幂律规律了。也就是说,大部分人都不怎么出远门,只有少部分异类会定期进行长途旅行。因此,每个人的预测程度存在很大不同这一点并不是讲不通的。如果一个人的生活局限在一个小圈子里,那么我们很容易就能找到他。但对于像哈桑那样定期去几千公里外的地方旅行的人,我们知道要想找到他们就很难了。
1703958081
1703958082 爆发洞察
1703958083
1703958084 不过,我们这次的直觉错了——预测性并不遵循我们熟悉的幂律规律。也就是说,不管我们多么努力地搜寻,数据库中都找不到异常值。相反,我们发现所有用户的平均可预测程度都在93%左右。这就意味着人们只有7%的时间是行踪不定的。这些不确定事件往往发生在两个人们最常去的地方之间——比方说在高峰期乘车上下班的时候,或者午饭计划有变动的时候。在剩下的时间里,大部分用户的行踪都相对容易预测。
1703958085
1703958086 对一些熵值低的用户来说,他们的可预测程度甚至接近100%。这并没有什么奇怪——它只能说明我们中有些人的生活非常规律罢了。真正令人意想不到的是,我们的案例中根本没有预测程度低于80%的人。不管他们的生活圈子有多大,搭乘什么样的交通工具,每个人都是习惯的奴隶,这使得他们的行踪变得极易预测。
1703958087
1703958088 我们的手机用户中没有哈里昆人,这不禁令我们困惑起来:那些随心所欲、反复无常的人都去哪儿了?他们到底藏在哪里?
1703958089
1703958090 在进一步讨论之前,我想说明的是“我们做了什么”和“我们的可预测程度有多高”之间存在本质的差别。当涉及“我们做了什么”这个问题——比方说我们的旅行距离,发邮件以及打电话的数量时,我们遵循幂律规律。也就是说,总有一些人比其他人更活跃,他们会发更多邮件,会去很远的地方旅行。这也说明异类很平常——总有一些哈桑那样的人,他们会定期去几百甚至上千公里外的地方旅行。
1703958091
1703958092 但一旦涉及人类行为的可预测度的问题,幂律规律令人吃惊地被高斯分布取代了。这意味着,不管你把自己禁锢在方圆2公里的社区内,还是每天驱车去数十公里外的地方,又或者是乘快车甚至是坐飞机上下班,你都和别人一样好预测。一旦高斯分布出现,异常值就不存在了,正如爆发在泊松的随机世界中不存在,或者不可能在街上看到一个3000米的巨人一样。虽然人与人之间有很多不同,但我们的可预测程度都差不多,无情的统计规律使得异类根本不存在。
1703958093
1703958094 但尽管统计规律百般阻挠、万般遏制,还是有人能够不受限制。这个人就是我们的朋友哈桑·伊拉希。
1703958095
1703958096 谁是异类
1703958097
1703958098 底特律被扣事件发生5年后,也就是他的追踪无常项目实施一年后,哈桑再次飞回美国。这次他乘坐的是伊比利亚航空公司的6251次航班,目的地是纽约的肯尼迪机场。最近,他过得非常自在,因为在满世界转悠的时候他几乎没再受到移民局的骚扰。但这次下飞机的时候,那种似曾相识的感觉又回来了——他又被带到一个特殊的房间隔离了起来,对方要求他在那里等候。
1703958099
1703958100 “我就在那儿一直等,一直等,一直等,”他回忆道,“有人进来问了一些问题后就走了,然后过了五分钟又有人进来问了一些其他问题后又走了。他们都是传话的人。我一直没能跟负责人说上话。”
1703958101
1703958102 最后,他听见一个探员对房间里的另一个人喊道:“嘿,坐伊比利亚航班来的那个家伙还在吗?”哈桑异常懊恼,他当然还在啊。然后他被带到了一间问讯室,这才弄清了事情的缘由。
1703958103
1703958104 并不是有人想告诉他发生了什么事。这种保密程序——问问题,不泄密,现在对哈桑来说已经再熟悉不过了。但是按照哈桑的话说,国土安全部是“一个非常粗心的机构”,所以即便他不想听也不想看也没辙。
1703958105
1703958106 比方说,他们在问讯室里落下了一张纸,刚好就放在他眼前。上面有一个被拒绝入境乘客的名单,而它明显对哈桑很不利。一定是有人粗心大意地将这张纸留在了这儿,恰好让哈桑发现那上面记了三个恐怖分子嫌疑人的名字。
1703958107
1703958108 那三个都是穆斯林的名字,一个来自巴基斯坦,一个来自沙特阿拉伯,剩下那个来自美国。而那个美国人正好是他自己——哈桑·伊拉希。
1703958109
1703958110 所以,哈桑最终弄清了自己被扣留的原因。其中那个巴基斯坦人已经因“间谍罪”被拘留了。另外那个来自沙特阿拉伯的人被怀疑是“军火走私者”。而哈桑——好吧,看到他名字后面写的被扣留的原因,他感到很困惑。
1703958111
1703958112 上面并未提到他那个“私藏弹药”的储藏库。
1703958113
1703958114 也没提他那个颇具讽刺意味的监视行动——追踪无常项目。
1703958115
1703958116 那张纸上写着:“9·11后形迹可疑”。
1703958117
1703958118 “那么,到底是什么让他们觉得我‘形迹可疑’?”想到文件上写的内容,哈桑忍不住夸张地说道:“说句题外话,关塔那摩监狱的一名叫克里夫·斯坦福·史密斯(Clive StaffordSmith)的律师说,他们发现了一份某人对自己为什么会被关进关塔那摩的原因的报告。那个人在报告中说原因是‘他下出租车的时候举止可疑’。”
1703958119
1703958120 哈桑说着说着就提高了音量。“一个人下车的方式有多少种?怎么区分哪些举止‘可疑’,哪些‘不可疑’呢?话又说回来,什么是‘可疑’的举止,什么又是‘不可疑’的举止呢?”
1703958121
1703958122 哈桑想不明白。但我不能稀里糊涂就扔下这件事,因为它产生了一种很重要的可能性:“可疑”是不是等于“不可预测”?
1703958123
1703958124 哈桑不在我们的手机用户数据库中,就算在我们也不知道,因为数据都是匿名的。不过由于他已经仔细追踪自己的行踪好几年了,所以我们不需要知道他的电话记录。他发给我们一个文件,里面包含2007年2月到2007年12月间他自己的一举一动。在这10个月里,他去了1040个不同的地方,足迹遍布美国和欧洲。看起来他好像去了很多地方,但实际上并不是。据我那支巨型GPS手表显示,在2007年的两个月时间里,我也去了515个不同的地方。[2]
1703958125
1703958126 爆发洞察
1703958127
1703958128 从某些方面看,虽然哈桑和我在运动上存在类似的地方,但我们俩其实非常不同。事实上,虽然我的生活不像麻省理工学院的学生们那么规律,但根据我80%的可预测程度,要想知道我的方位并不难。然而,当瞿泽辉利用预测系统分析哈桑的数据时,他遭遇了一次惨不忍睹的失败——他试了4000多次,但只有3次能正确预见哈桑的位置。即便使用往世界地图上扔飞镖的方法来决定他的位置都比这准确度高。实际上,哈桑就是一个哈里昆人,是完全不可预测的。
1703958129
[ 上一页 ]  [ :1.70395808e+09 ]  [ 下一页 ]