打字猴:1.703957869e+09
1703957869
1703957870 每个人并没有走远
1703957871
1703957872 要认识到手机数据的重要性,我们应注意到乔治网网民追踪的是钞票,不是人。也就是说,盖瑞在俄亥俄州的枪展上标记的那张钞票又在佛罗里达现身,绝不意味着从盖瑞那儿买枪的那个人现在正在佛罗里达国家公园的沼泽地上捕杀鳄鱼。
1703957873
1703957874 事实上,那人很可能又去旁边的摊位用那张钞票买了一张保险杠贴纸。然后,这张钞票可能又到了一个业余猎手的手里,而他又在宾夕法尼亚的一个加油站用掉了它,之后它可能又落到了一个要去佛罗里达的卡车司机的口袋里。当一个在迈阿密海滩度假的人得闲将这张钞票的序列号输入乔治网的时候,它可能已经被世界各地的很多人用过了。
1703957875
1703957876 所以,钞票的运动并不代表人的运动。相反,钞票就像个正在被传递的接力棒——它们从一个赛跑者手里传到另一个赛跑者手里,沿着相同的路线被传递了很多次。
1703957877
1703957878 基于这一不足,德克又被一个很重要的问题卡住了:每个人每天的旅行路程到底是多少?德克可以观察到钞票的运动轨迹,但无法弄清每个携带者的运动模型。这就像你在黑暗中看一场接力赛,只有发光的接力棒在神奇地沿着跑道运动。
1703957879
1703957880 而玛尔塔的手机数据则像个能看到每个人的实际运动情况的更加精密的显微镜。在研究生西泽·伊达尔戈(Cesar Hidalgo)的协助下,玛尔塔再现了一个用户的运动轨迹并将其圈定,然后对这位用户经常活动的区域做了估计。之后,她又用同样的方法分析了10万个用户。
1703957881
1703957882 玛尔塔能圈定这些区域让我们很担忧,因为理论上讲人类或猴子的运动都不会严格遵守列维模型已经是板上钉钉的事了。实际上,只要你去调查一只猴子过去的运动轨迹就会发现,它们肯定会去一个之前没去过的地方找寻香蕉树。总的来说,猴子遵循列维模型运动得越久就会离出发点越远,因此就必须圈定一个更大的区域以追踪它的行踪。还记得那个定律吗?如果人类遵循列维模型运动,那么就可能永远无法找到回家的路。他们会越走越远,直到死去。
1703957883
1703957884 正如定律所估计的那样,人类显然没注意到这一点。玛尔塔发现,大多数人并没有走远,而是在一个固定区域内活动。也就是说,每个人的活动都局限在某个特定的区域内。
1703957885
1703957886 我们对此并没有感到特别吃惊:我们有家有工作,所以总是在这两点一线间往返,很少会偏离轨道。玛尔塔的发现令我们感兴趣的一个最主要的原因是,我们的运动根本就没遵守列维模型。
1703957887
1703957888 但当玛尔塔比较每个人的活动区域的半径时,我们真的吃了一惊。“我的日常生活距离跟你们,还有成千上万的其他人的差别到底有多大呢?”她在探究人类本质差异的时候这样问道。很明显,除非你和我在一起住并在一起工作,不然我们的生活鲜有交集。但基于上下班的交通以及吸引我们的事物或多或少存在的相似性,我们的生活圈真的没有可比性吗?
1703957889
1703957890 爆发洞察
1703957891
1703957892 事实上不是:幂律分布再次从玛尔塔的分析中浮现。研究发现,我们大部分人的生活圈子都很小,最多不过几公里,我们在这一区域内做规则的往返运动。高度本地化的大多数人和每天旅行几十公里的一部分人,以及每次会旅行上百公里的少部分人共同生活在这片天空下。这些活动范围大的人并不是跟我们一样偶尔在节假日或谈生意的时候出趟远门。他们都是哈桑·伊拉希那样的人。这些“脚痒”的人经常会在世界各地游走。[1]
1703957893
1703957894 哈桑也有家,也有工作场所,但奇怪的是你几乎不可能在那附近找到他。因此,将他的日常活动范围跟大部分人一比,我们就会发现他显得有些不平常。没错,他就是个异类。
1703957895
1703957896 虽然他的异类使他变得有些特别,但他绝不是独一无二的。事实表明,我们的数据库中像他一样的人很多。
1703957897
1703957898 爆发洞察
1703957899
1703957900 如果我们所有人的日常活动范围都差不多,那么异类就会非常稀有,而且会让人们觉得吃惊。但事实上,这在充满泊松或高斯分布的世界中是不可能出现的。在那个世界里,你我的活动范围基本上没什么差异。不过,一旦我们的日常活动符合幂律分布,异常值不但是被允许的,甚至还是我们所期盼的数据。它们相当于理查森搜集的战争数据库中的世界大战,或是帕累托财富分布中的洛克菲勒或比尔·盖茨。
1703957901
1703957902 毫无疑问,德克是对的:钞票的运动就是遵循列维飞行模型。我们看似得不出的结论事实上出现了。如果钞票落入那些活动区域小的人手中,它就不会走太远;但如果钞票落入了哈桑或卡车司机这类异类手中,那么它可能会在千里之外的地方才会被花掉。这就像一场小孩儿和奥运选手共同参加的奇怪接力赛。如果接力棒在小孩儿手中,它就会在一定区域来回运动;但如果被奥运选手拿到了,想赶上他就困难了。
1703957903
1703957904 最后,玛尔塔发现,钞票的运动之所以符合列维模型并不是因为我们每个人都在做列维运动,而是因为我们中间存在异类。还记得吗?乔治网追踪的是现金,不是消费者。社会的异质性——大部分喜欢居家的人跟少数环球旅行者之间存在很大不同,使钞票得以长时间待在同一个地方,只是偶尔出趟远门。这是一个虽奇怪但很自然的模型——正好符合德克最初的发现。
1703957905
1703957906 手机数据,让我们回家
1703957907
1703957908 在爱德华、谢尔盖以及他们的团队推翻了信天翁的觅食遵循列维飞行运动模型的观点四个月后,《自然》杂志又刊登了一篇关于这个问题的论文。普利茅斯大学海洋生物学协会(Marine Biological Association Laboratory)的动物研究学者大卫·西姆斯(David Sims)对海洋动物和它们的运动习性进行了大量研究。他的研究小组搜集了上百万条关于多种水生物的活动的数据。他们得出结论:鲨鱼、硬骨鱼、海龟以及企鹅的活动都符合列维飞行运动模型。于是,对列维飞行的研究就好比坐上了令人恶心眩晕的过山车。让我们再重新审视一下这个曲折的过程吧。
1703957909
1703957910 ●1996年,谢尔盖和他的同伴发现信天翁的运动符合列维轨迹。这个发现促使人们将从猴子到熊蜂的动物界研究了个遍,而且发现它们都遵循列维模型。
1703957911
1703957912 ●2007年,谢尔盖和他的同伴重新审视了这一发现,并指出漂泊信天翁进行的是随机运动。然而,如果列维飞行是最好的觅食方法,为何自然选择不强制动物利用它呢?
1703957913
1703957914 ●2008年2月,大卫·西姆斯又指出动物们确实遵循列维模型。虽然有些数据记录超出了他们的控制能力,但事实证明谢尔盖最初的发现是正确的。这使我们又回到了起点:尽管我们不太清楚信天翁的习性,但大部分动物的运动还是符合爆发列维模型。
1703957915
1703957916 科学研究本身也经常遵循列维模型——一个飞跃性的发现总是伴随着很多不起眼的小发现,有些甚至是相悖的发现。然而,这些并非无用的努力,而是检验一项新发现的必要工具。
1703957917
1703957918 在涉及人类问题时,这种曲折更是引人入胜。2006年,布洛克曼发现美元的流通遵循列维模型,指出人类的日常活动跟信天翁或猴子没什么差别。这项发现意义重大,它表明了虽然我们的食物不再紧缺,但进化过程中我们脑中根深蒂固的觅食习惯还是没有改变。但是当我们开始通过手机记录匿名追踪每个人的行踪时,我们又发现钞票的流通并不能说明每个人的旅行模型,而是揭示了每个人旅行习惯的不同。钞票流通距离的不同揭示了我们之间存在能够影响全局——从病毒的传播到城市资源管理的异类。
[ 上一页 ]  [ :1.703957869e+09 ]  [ 下一页 ]