1703948124
对地理位置的数据化需要满足一些前提条件。我们需要能精确地测量地球上的每一块地方;我们需要一套标准的标记体系;我们需要收集和记录数据的工具。简而言之,就是地理范围、标准、工具或者说量化、标准化、收集。只有具备了这些,我们才能把位置信息当成数据来存储和分析。
1703948125
1703948126
在西方,对位置信息的量化起源于希腊。公元前200年,埃拉托色尼发明了用格网线来划分区域的系统,类似于经纬度法。但是,如同很多古代的好想法一样,它也在历史长河中被慢慢遗忘了。大约1500年之后,也就是公元1400年,托勒密著成的《地理学》(Geographia)的复印本从君士坦丁堡传到了佛罗伦萨,那正是文艺复兴和贸易船点燃了对科学和古典知识的热情的时候。著作轰动一时,而书中提到的系统现在仍被用来解决航海导航的难题。从那以后,地图上标上了经纬度和比例尺。这套系统在1570年得到了佛兰德制图师墨卡托的改善,至此海员们就能利用它画出笔直的航线了。
1703948127
1703948128
虽然那时就出现了记录地理方位的方法,但却缺乏广为认可的标记标准,使得信息共享依然难以实现。人们急需一套标准的标记系统,就像互联网需要有域名才能正常运行一样。经纬度的标准化是一个漫长的过程。直到1884年,在美国华盛顿召开的国际子午线会议上,25个与会国家中的24个国家一致同意将英格兰格林尼治定为本初子午线和零度经线所穿过的地方(只有自命不凡的法国投了弃权票)。20世纪40年代,墨卡托方位法把世界划分成了60个区域,提高了地理定位的精确性。
1703948129
1703948130
这样一来,地理定位信息终于能在标准化的数值范式下进行标记、记录、测量、分析和共享了。但是因为在模拟数据时代,测量和记录地理位置信息耗费很大,人们很少执行。因此,发明能低成本测量地理方位的工具迫在眉睫。到20世纪70年代,进行地理位置定位还只能依靠地标、天文星座、航位推测法和尚显欠缺的无线电定位技术。
1703948131
1703948132
1978年见证了一个伟大的转变,当时构成全球定位系统(GPS)的24颗卫星第一次发射成功。无论是汽车上的导航系统还是智能手机,地面上的接收器都能通过计算接收信号所需时间的差异对它们进行三角定位,而这些信号就来自于距离我们20372千米的天空。20世纪80年代,这个系统第一次对民用开放,到90年代才完全投入使用,而同时为了实现商业运用,它的精确度在十年后得到了大幅提升。如今,全球定位系统的地理定位能精确到米,就这样,它实现了自古以来无数航海家、制图家和数学家的梦想。通过与技术手段的融合,全球定位系统能够快速、相对低价地进行地理定位,而且不需要任何专业知识。
1703948133
1703948134
定位时时刻刻都可能生成信息。只要愿意,埃拉托色尼或者墨卡托大可以每时每刻都对他们所处的位置进行定位,这谁也管不着。但就算这是可行的,也不现实。同样地,早期的接收器非常复杂和昂贵,适用于潜艇而不是出租车。幸好,改变发生了,这多亏了数字设备中廉价芯片的普及。GPS导航的价格由20世纪90年代的上百美元骤降到了今天的1美元以下。用GPS进行定位一般仅需要几秒钟的时间,它使用的是标准化坐标表示法;所以37°14′06″N 115°48′40″W说明这个人一定是位于内华达州偏远的51号区域(Area 51),一个美军超高安全、超级保密的军事基地——传说那里面关的都是外星人呢!
1703948135
1703948136
如今,GPS已经只是众多定位系统中的一种了。中国和欧洲也正在研发新的卫星定位系统来与之抗衡。这些新系统通过对电塔和无线路由器的信号强度进行三角测量来定位地理位置,从而弥补了GPS无法在室内和高楼之间进行定位的缺陷,这也是谷歌、苹果和微软需要自己研发地理定位系统来辅助GPS的原因。谷歌的街景车(Street View Cars)边拍照边收集无线路由器信息;iPhone本身就是一个“移动间谍”,一直在用户不知情的情况下收集位置和无线数据然后传回苹果公司;当然,谷歌的安卓手机和微软的手机操作系统也在收集这一类数据。
1703948137
1703948138
除了人以外,我们也可以跟踪事物的地理位置信息。随着汽车装上了无线传感器,地理位置信息的数据化深刻变革了保险的概念。这些数据提供了关于时间、地点和实际行驶路程的详细信息,使保险公司能更好地为车险定价。在英国,车主可以根据他的实际驾驶地点和时间购买汽车保险,而不是只能根据他的年龄、性别和履历来购买年险。这种保险定价法激励投保人产生更好的行为习惯。同时,这改变了保险的基础,从考虑一个群体的平均风险转变为个性化的分析。通过汽车定位每个人的地理方位也改变了一些固定资产投入的模式,比方说公路和其他基础设施可以让使用这些资源的司机和其他人分担一部分投入。当然,在实现对所有人和事以数据形式保持持续定位之前,这显然还无法实现,但这是我们的发展方向。
1703948139
1703948140
大数据先锋
1703948141
1703948142
多效地理定位与UPS的最佳行车路径
1703948143
1703948144
UPS快递多效地利用了地理定位数据。为了使总部能在车辆出现晚点的时候跟踪到车辆的位置和预防引擎故障,它的货车上装有传感器、无线适配器和GPS。同时,这些设备也方便了公司监督管理员工并优化行车线路。就像莫里的图表是基于过去的航海经验一样,UPS为货车定制的最佳行车路径一定程度上也是根据过去的行车经验总结而来的。
1703948145
1703948146
UPS的过程管理总监杰克·莱维斯(Jack Levis)认为这个分析项目效果显著。2011年,UPS的驾驶员们少跑了近4828万公里的路程,节省了300万加仑的燃料并且减少了3万公吨的二氧化碳排放量。系统也设计了尽量少左转的路线,因为左转要求货车在交叉路口穿过去,所以更容易出事故。而且,货车往往需要等待一会儿才能左转,也会更耗油,因此,减少左转使得行车的安全性和效率都得到了大幅提升。
1703948147
1703948148
莱维斯说,“预测给我们知识,而知识赋予我们智慧和洞见。”他很确信,有一天,这个系统一定能在用户意识到问题之前预测到并且解决问题。
1703948149
1703948150
数据化实时位置信息在人身上的运用最为显著。多年来,无线运营商通过收集和分析这些信息来提升移动互联网的服务水平。不过,这些数据越来越多地被用于其他事情上,第三方也开始利用这些数据来提供新的服务。比方说,一些智能手机的应用程序也不管它本身是否具有定位功能,就收集位置信息;还有一些应用程序就是为了获得用户的位置信息而存在的,比如Foursquare,它让用户在最喜爱的地方“check in”,通过忠诚度计划、酒店推荐和“check in”地点附近的其他推荐而获得好处。
1703948151
1703948152
毋庸置疑,收集用户地理位置数据的能力已经变得极其具有价值。从个人层面上来说,根据他所居住的地点和他要去的地方的预测数据,可以为他提供定制广告。而且,这些信息汇集起来可能会揭示事情的发展趋势。[7]比方说,公司可以利用大量的位置数据预测交通情况,你也许无法想象,这是通过高速公路上的手机而不是汽车的数量和移动速度预测出来的。AirSage每天通过处理来自上百万手机用户的150亿条位置信息,为超过100个美国城市提供实时交通信息。其他两个位置数据服务商Sense Networks和Skyhook使用位置数据揭示城市夜生活最繁荣的地方或者游行队伍聚集了多少人。
1703948153
1703948154
不过,位置数据在商业以外的用途或许才是最重要的。麻省理工学院媒体实验室人类动力学[8]实验室主任亚历山大·彭特兰(Alexander “Sandy”Pentland)和他的学生南森·伊格尔(Nathan Eagle)是所谓的“现实挖掘”研究的先驱。“现实挖掘”这里指的是通过处理大量来自手机的数据,发现和预测人类行为。在一项研究中,他们通过分析每个人去了哪里、见了谁,成功地区分出了感染了流感的人群,而且在感染者还完全不知道自己已经患病之前就做出了区分。如果出现非常严重的流感疫情,这可以挽救无数人的生命,因为我们会知道应该隔离谁,而且随时都知道去哪里找到他。但是这些数据一旦落入坏人之手,后果将不堪设想,这个问题我们将在后文中继续讨论。
1703948155
1703948156
伊格尔是无线数据科技公司Jana的创始人,他使用了来自100多个国家的超过200个无线运营商的手机数据——覆盖了拉丁美洲、非洲、欧洲的大约35亿人口。伊格尔的研究既关注家庭主妇平均每周去几次洗衣店这样的肥皂问题,也试图回答关于疾病如何传播和城市如何繁荣这样的重大问题。在一项研究中,他和同事结合分析了非洲预付费用户的位置信息和他们账户的资费金额,发现资费与收入成正比:越富有的人一次性预付费越多。然而,他们还得出了一个与直觉判断相反的结果,那就是贫民窟不仅仅是永恒不变的贫困中心,还是经济繁荣的跳板。关键就在于,我们要意识到这都是手机所提供的位置信息的间接利用,而和移动通信自身业务没有丝毫关系,但是这些数据最初又是为了更好地开展移动通信而生成的。总之,位置信息一被数据化,新的用途就犹如雨后春笋般涌现出来,而新价值也会随之不断催生。
1703948157
1703948159
当沟通变成数据
1703948160
1703948161
数据化的另一个前沿更加个人化,直接触摸到了我们的关系、经历和情感。数据化的构思是许多社交网络公司的脊梁。社交网络平台不仅给我们提供了寻找和维持朋友、同事关系的场所,也将我们日常生活的无形元素提取出来,再转化为可作新用途的数据。正因此,Facebook将关系数据化——社交关系在过去一直被视作信息而存在,但从未被正式界定为数据,直到Facebook“社交图谱”的出现。Twitter通过创新,让人们能轻易记录以及分享他们零散的想法(这些在以前,都会成为遗忘在时光中的碎片),从而使情绪数据化得以实现。LinkedIn将我们过去漫长的经历进行了数据化处理,就像莫里转化旧航海日志那样,把信息转化为对现在和将来的预测:我们可以认识谁,或者哪里存在一份心仪的工作。
1703948162
1703948163
然而,数据的使用还远未成熟。就Facebook的情况来说,因为知道太早泄露用户数据的许多新用途会让用户反应过激,所以它精明地选择了忍耐。另外,公司仍然在为其收集的数据数量和类型,包括隐私问题进行商业模式和政策上的调整。目前,它所面对的指责都集中在能采集到什么,而并非它实际用这些数据干了什么。
1703948164
1703948165
大数据的力量
1703948166
1703948167
Facebook2012年拥有大约10亿用户,他们通过上千亿的朋友关系网相互连接。这个巨大的社交网络覆盖了大约10%的全球总人口。[9]想想这所有的关系和活动在数据化之后都为一家公司所掌控,这些指责和质疑就不能算作空穴来风。
1703948168
1703948169
不可否认,其潜在用途非比寻常。一些消费者信贷领域的创业公司正考虑开发以Facebook社交图谱为依据的信用评分。FICO,信用评分系统,利用15个变量来预测单个借贷者是否会偿还一笔债务。但一家获得了高额风险投资的创业公司(很遗憾这里必须匿名)的一项内部研究显示,个人会偿还债务的可能性和其朋友会偿还债务的可能性呈正相关。正应了一句老话:物以类聚,人以群分。因此,Facebook也可以成为下一个FICO。显然,社交媒体上的大量数据也许能形成放飞想象的新型商务基础,其意义远不止表面上我们看到的照片分享、状态上传以及“喜欢”按钮。
1703948170
1703948171
同样,Twitter也已经开辟了其数据的新用途。从某种程度上说,2012年超过1.4亿用户每天发送的4亿条微博几乎就和随意的口头零碎差不多。事实上,它们通常就是如此。然而,Twitter公司实现了人们想法、情绪和沟通的数据化,这些都是以前不曾实现的。Twitter与两家公司,DataSift和Gnip达成了一项出售数据访问权限的协议。[10]许多公司对微博做了句法分析,有时还会使用一项叫作情感分析的技术,以获得顾客反馈意见的汇总或对营销活动的效果进行判断。
1703948172
1703948173
两家对冲基金,伦敦的英国对冲基金(Derwent Capital)和加利福尼亚的MarketPsych开始分析微博的数据文本,以作为股市投资的信号(他们从未公开自己的商业秘决,也不知道是倾向于投资势头良好的公司还是做空)。两家公司现在都在向经商者出售信息。就MarketPsych而言,它与Thomson Reuters合作提供了分布在119个国家不低于18864项的独立指数,比如每分钟更新的心情状态,如乐观、忧郁、快乐、害怕、生气,甚至还包括创新、诉讼及冲突情况等。
[
上一页 ]
[ :1.703948124e+09 ]
[
下一页 ]