1703948174
1703948175
数据被人类利用的频率远没有被计算机利用得多。以“金融工程师”而闻名的华尔街的数学奇才们,将数据传输到了他们的算法模式当中,来寻找能被有效利用并实现赢利的隐性联系。根据“社交网络分析之父”贝尔纳多·哈柏曼(Bernardo Huberman)[11]的分析,微博中单一主题出现的频率可以用来预测很多事情,比如好莱坞的票房收入。他和一位在惠普实验室工作的同事开发了一个程序,可以用来监听新微博的发布频率,基于此,他们就能预测一部电影的成败,这往往比其他传统评估预测方法还要准确。
1703948176
1703948177
这些数据的用途不胜枚举。Twitter微博限制在稀少的140个字符中,但与每条微博联系在一起的元数据是十分丰富的。Twitter的元数据,即“关于信息的信息”,其中包括33个分离的项。虽然一部分信息似乎并没多大用处,比如Twitter用户界面上的“墙纸”或用户用来访问这项服务的软件,但其他的元数据却很有意思,比如他们参与服务所使用的语言、所处的地理位置、关注的人以及粉丝的数量和名字。2011年《科学》杂志上的一项研究显示,来自世界上不同文化背景的人们每天、每周的心情都遵循着相似的模式,这项研究建立在两年多来对84个国家240万人的5.09亿条微博的数据分析上,这在以前是完全无法做到的。情绪真的已经被数据化了。
1703948178
1703948179
数据化不仅能将态度和情绪转变为一种可分析的形式,也可能转化人类的行为。这些行为难以跟踪,特别是在较大的社区和其中的子人群环境中。
1703948180
1703948181
大数据先锋
1703948182
1703948183
微博关联与疫苗接种
1703948184
1703948185
来自宾夕法尼亚州立大学的生物学家马塞尔·萨拉特(Marcel Salathé)和软件工程师沙先克·坎都拉斯(Shashank Khandelwal)通过分析微博发现,人们对于疫苗的态度与他们实际注射预防流感药物的可能呈现出相关性。重要的是,他们利用Twitter用户中谁和谁相关的元数据进行了更进一步的调查,发现未接种疫苗的子人群也可能存在。当然,这项研究的特别之处在于,不同于如谷歌预测流感趋势时利用汇总数据考虑一个地区人口的“平均”健康状况,萨拉特开展的情绪分析实际上揭示了个人的卫生行为。
1703948186
1703948187
这些早期的发现预示了数据化将走向何方。和谷歌一样,一些社交网络(如Facebook,Twitter,LinkedIn,Foursquare)坐拥了大型数据的宝藏,一旦这些数据信息得到了深入分析,它们就能轻易获得社会各行各业以及三教九流的几乎所有的动态信息。
1703948188
1703948190
世间万物的数据化
1703948191
1703948192
只要一点想象,万千事物就能转化为数据形式,并一直带给我们惊喜。IBM获得的“触感技术先导”专利与东京的越水重臣教授对臀部的研究工作具有相同理念。知识产权律师称那是一块触感灵敏的地板,就像一个巨大的智能手机屏幕。其潜在的用途十分广泛。它能分辨出放置其上的物品。它的基本用途就是适时地开灯和开门。然而更重要的是,它能通过一个人的体重、站姿和走路方式确认他的身份。它还能知道某人在摔倒之后是否一直没有站起来。有了它,零售商可以知道商店的人流量。当地板数据化了的时候,它就能滋生无穷无尽的用途。
1703948193
1703948194
其实没有听上去那么荒谬。“自我量化”是一项由一群健身迷、医学疯子以及技术狂人发起的运动,通过测量身体的每一个部位和生活中的每一件事来让生活更美好——或者至少用量化的方式来获得新知。目前,自我量化运动规模还很小,但正在日益壮大。
1703948195
1703948196
随着智能手机和计算机技术的普及,对个人最重要的生活行为进行数据处理从未如现在这般容易。许多创业公司通过测量人们夜间的脑电波来试图找出他们的睡眠模式。Zeo公司则早已制作出了世界上最大的睡眠活动数据库,揭示了男性与女性睡眠时快速眼动量的差异。Asthmapolis公司将一个感应器绑定到哮喘病人佩戴的呼吸器上,通过GPS定位,再汇总收集起来的位置数据,可以判断环境因素(如接近特定的农作物)对哮喘的影响。Fitbit和Jawbone公司让人们测量他们的体力活动和睡眠。Basis公司用腕带来监测佩戴者的生命体征,包括其心率和皮肤电传导率,以此测试他们所承受的压力。2009年,苹果公司就申请了一项专利,通过音频耳塞收集关于血液氧合、心率和体温的数据。获取数据正变得比以往任何时候都简单而不受限制。
1703948197
1703948198
数据化能帮助我们获取到更多关于人体运作方式的信息。挪威耶维克大学的研究人员和Derawi Biometrics公司联合为智能手机开发了一款应用程序,可以分析人走路时的步伐并将其作为手机解锁的安全系统。同时,佐治亚理工学院的罗伯特·德拉诺(Robert Delano)和布莱恩·派尔思(Brian Parise)开发了一款叫做iTrem的应用程序,用手机内置的测震仪监测人身体的颤动,以应对帕金森和其他神经系统疾病。这个程序给医生和病人都带来了好处;它让患者避免了在医院做昂贵的体检,也让医学专家们能远程监控人们的疾病以及治疗效果。据东京的调查人员说,用智能手机测量震动虽然没有三轴测震仪这种专门的医疗器械那么精确,但也只差了一点,所以完全可以放心使用。这再一次证明,一点点的不精确比完全精确更有效。
1703948199
1703948200
在大多数情况下,我们会采集信息并将之存储为数据形式再加以利用。几乎所有领域,任何事情都能这样处理。GreenGoose是一家创业公司,他们销售能放置在物品上的微型运动感应器,用它监测物品的使用次数。比如把它放置在一捆牙线、一个洒水壶或者一盒猫食上,就能数据化牙齿清洁、植物护理以及宠物喂养的信息。很多人对“物联网”有着宗教般的狂热,试图在一切生活中的事物中都植入芯片、传感器和通信模块。这个词听起来好像和互联网亲如姐妹,其实不过是一种典型的数据化手段罢了。
1703948201
1703948202
大数据洞察
1703948203
1703948204
一旦世界被数据化,就只有你想不到,而没有信息做不到的事情了。莫里通过艰辛的人工分析才揭示了隐藏在数据中的价值,而今天,拥有了数据分析的工具(统计学和算法)以及必需的设备(信息处理器和存储器),我们就可以在更多领域、更快、更大规模地进行数据处理了。在大数据时代,惊喜无处不在!
1703948205
1703948206
我们正在进行一个重大的基础设施项目,它在某种程度上与我们过去所做的都不一样,无论是罗马的水渠还是启蒙运动时期的百科全书。它如此的新颖,而我们又深处其中;同时,又因为它是无形的,不像水渠中能触摸到的水,所以我们并未意识到它的存在。这个它,就是无处不在的数据化。像其他的基础设施那样,它会给社会带来根本性的变革。
1703948207
1703948208
水渠让城市的发展成为可能,印刷机推进了启蒙运动,报纸为民族国家的兴起奠定了基础。但这些基础设施都侧重于流动——关于水、关于知识。电话和互联网也是如此。相比较而言,数据化代表着人类认识的一个根本性转变。有了大数据的帮助,我们不会再将世界看作是一连串我们认为或是自然或是社会现象的事件,我们会意识到本质上世界是由信息构成的。
1703948209
1703948210
整整一个多世纪以来,物理学家们一直宣称情况应该是这样的——并非原子而是信息才是一切的本源。[12]不可否认,这也许听上去无法理解。然而通过数据化,在很多情况下我们就能全面采集和计算有形物质和无形物质的存在,并对其进行处理。
1703948211
1703948212
将世界看作信息,看作可以理解的数据的海洋,为我们提供了一个从未有过的审视现实的视角。它是一种可以渗透到所有生活领域的世界观。
1703948213
1703948214
大数据洞察
1703948215
1703948216
今天,我们生活在一个计算型的社会,因为我们相信世界可以通过数字和数学而获得解释。我们也相信知识可以跨越时空。事实上,我们对书写还存在着一种根深蒂固的敬畏。明天,我们的下一代,一群被“大数据观念”陶冶长大的家伙,会发自肺腑地认为“量化一切”并从中学习对于社会是至关重要的。把各种各样的现实转化为数据,对今天的我们而言也许是新奇而有趣的,但在不久的将来,这将变成如同吃饭睡觉一样与生俱来的能力——这又让我想起了“数据”这个词语的拉丁语原意。
1703948217
1703948218
迟早有一天,数据化的影响会使水渠和报纸的影响微乎其微,同时,通过赋予人类数据化世间万物的工具,它也对印刷机和互联网的地位提出了挑战。可是目前,它最主要的用途还是在商业领域。大数据正被用来创造新型价值,这也是下一章的主题。
1703948219
1703948220
[1] 一种在线社交网络,其典型营销方式是,一旦你加入了,系统会自动从你注册或关联的邮箱中找到联系人,并发信邀请他们加入。很多读者应该都收到过LinkedIn的邀请信,就是一个典型的例子。——译者注
1703948221
1703948222
[2] 欧洲人没有接触过东方的算盘,后来证明这是很有利的,因为算盘可能会加剧罗马数字在西方的盛行。——作者注
1703948223
[
上一页 ]
[ :1.703948174e+09 ]
[
下一页 ]