1703947283
大数据标志着人类在寻求量化和认识世界的道路上前进了一大步。过去不可计量、存储、分析和共享的很多东西都被数据化了。拥有大量的数据和更多不那么精确的数据为我们理解世界打开了一扇新的大门。社会因此放弃了寻找因果关系的传统偏好,开始挖掘相关关系的好处。
1703947284
1703947285
寻找原因是一种现代社会的一神论,大数据推翻了这个论断。但我们又陷入了一个历史的困境,那就是我们活在一个“上帝已死”的时代。也就是说,我们曾经坚守的信念动摇了。讽刺的是,这些信念正在被“更好”的证据所取代。那么,从经验中得来的与证据相矛盾的直觉、信念和迷惘应该充当什么角色呢?当世界由探求因果关系变成挖掘相关关系,我们怎样才能既不损坏建立在因果推理基础之上的社会繁荣和人类前行的基石,又取得实际的进步呢?本书意在解释我们身在何处,我们从何而来,并且提供当下亟需的指导,以应对眼前的利益和危险。
1703947286
1703947287
[1] Netflix,也常译作网狸公司。——译者注
1703947288
1703947289
[2] 马奇诺防线是法国在第一次世界大战后,为防德军入侵而在其东北边境地区构筑的筑垒配系,以其陆军部长姓氏命名。1940年5月至6月,德国主力通过阿登山脉,从马奇诺防线左翼迂回,进抵马奇诺防线的后方,使防线丧失了作用。“马奇诺防线”现在用来意指看似表面坚固,实际毫无价值的东西。——译者注
1703947290
1703947291
1703947292
1703947293
1703947295
大数据时代:生活、工作与思维的大变革 第一部分 大数据时代的思维变革
1703947296
1703947298
01 更多:不是随机样本,而是全体数据
1703947299
1703947300
当数据处理技术已经发生了翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马一样。一切都改变了,我们需要的是所有的数据,“样本=总体”。
1703947301
1703947302
【大数据先锋】
1703947303
1703947304
穿孔卡片与美国人口普查
1703947305
1703947306
大数据与乔布斯的癌症治疗
1703947307
1703947308
Xoom与跨境汇款异常交易报警
1703947309
1703947310
巴拉巴西与第一次全社会层面的网络分析
1703947311
1703947313
让数据“发声”
1703947314
1703947315
“大数据”全在于发现和理解信息内容及信息与信息之间的关系,然而直到最近,我们对此似乎还是难以把握。IBM的资深“大数据”专家杰夫·乔纳斯(Jeff Jonas)提出要让数据“说话”。从某种层面上来说,这听起来很平常。人们使用数据已经有相当长一段时间了,无论是日常进行的大量非正式观察,还是过去几个世纪里在专业层面上用高级算法进行的量化研究,都与数据有关。
1703947316
1703947317
在数字化时代,数据处理变得更加容易、更加快速,人们能够在瞬间处理成千上万的数据。但当我们谈论能“说话”的数据时,我们指的远远不止这些。
1703947318
1703947319
实际上,大数据与三个重大的思维转变有关,这三个转变是相互联系和相互作用的。
1703947320
1703947321
●首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本。
1703947322
1703947323
●其次,我们乐于接受数据的纷繁复杂,而不再追求精确性。
1703947324
1703947325
●最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。
1703947326
1703947327
本章就将介绍第一个转变:利用所有的数据,而不再仅仅依靠一小部分数据。
1703947328
1703947329
很长一段时间以来,准确分析大量数据对我们而言都是一种挑战。过去,因为记录、储存和分析数据的工具不够好,我们只能收集少量数据进行分析,这让我们一度很苦恼。为了让分析变得简单,我们会把数据量缩减到最少。这是一种无意识的自省:我们把与数据交流的困难看成是自然的,而没有意识到这只是当时技术条件下的一种人为的限制。如今,技术条件已经有了非常大的提高,虽然人类可以处理的数据依然是有限的,也永远是有限的,但是我们可以处理的数据量已经大大地增加,而且未来会越来越多。
1703947330
1703947331
在某些方面,我们依然没有完全意识到自己拥有了能够收集和处理更大规模数据的能力。我们还是在信息匮乏的假设下做很多事情,建立很多机构组织。我们假定自己只能收集到少量信息,结果就真的如此了。这是一个自我实现的过程。我们甚至发展了一些使用尽可能少的信息的技术。别忘了,统计学的一个目的就是用尽可能少的数据来证实尽可能重大的发现。事实上,我们形成了一种习惯,那就是在我们的制度、处理过程和激励机制中尽可能地减少数据的使用。为了理解大数据时代的转变意味着什么,我们需要首先回顾一下过去。
1703947332
[
上一页 ]
[ :1.703947283e+09 ]
[
下一页 ]