1704600163
大数据经济:大数据时代,互联网加法如何做? 数据已成为生活必需品?
1704600164
1704600165
在很多会议上,总听到一些专家们开讲大数据时以引用名人的话开头说:“不要迷信数据,数据只是底层的东西,没什么价值。真正重要的是如何把数据变成信息,信息变成知识,知识变成智慧,即所谓 Data-Information-Knowledge-Wisdom 金字塔,简称 DIKW 模型。”这个在 20 世纪 90 年代初期形成的说法流行一时,被写进很多计算机教科书里,以至于今天还有许多出了校门就不再读书思考的人将其奉为不变真理,即使过了四分之一世纪后仍旧不假思索地照本宣科。
1704600166
1704600167
在这些人眼中,“数据”和“大数据”其实是一个概念,只有量的多少,没有质的差别。这种说法迷惑了很多外行人,或者以为大数据不过是层出不穷的时髦概念中的一个,没什么实质性内容;或者以为大数据不过是古已有之的数据概念的扩展和延伸,继续过去的思路去把握即可。
1704600168
1704600169
其实,DIKW 模型不过是古希腊哲学中形式逻辑基本架构的现代翻版,没什么新意。在亚里士多德那里,形式逻辑的最基本要素是概念,确定概念间关系的是命题,命题推演开来得到定理或推论,所谓智慧,无非是将众多定理和推论进行更抽象的思考和分析的能力。早期计算机发展中主要遵循形式逻辑的规则,人们输入若干搜集来的数据,然后通过机器的逻辑运算获得数据间各种数量关系和相关关系。在此基础上,人们用头脑去做进一步的推论。所以,有些人认为,机器最多可以处理数据和信息,知识和智慧只能通过人脑形成。人类思维能力的神秘性、智慧的崇高性,乃至于掌握了若干知识和智慧能力的精英们的社会地位和影响力,无不基于这一假设。
1704600170
1704600171
社会的发展开始打破这一古老的传说,而最终暴露出这种传说的谬误的力量来自由数据向大数据演变的过程。无论数据还是大数据,从表面形式看都是一堆数据而已,但本质上二者逐渐产生多方面的差异。
1704600172
1704600173
首先,数据的产生早已不是仅仅局限于若干实验室和办公室,由若干经过训练的专业人士采集整理而成,而是万事万物都在数据化,数据成为世界的另外一种存在形式。今天绝大部分的数据都不是人们有目的、有意识、在一个封闭环境中进行分析利用的产物,而是人们为了实现其他目的而不得不制造出的东西。这些东西对特定目的而言,是噪音,是垃圾,是负担,既不是信息,也不能产生知识和智慧。人们现有知识和智慧所能处理的数据大概仅占现有数据量的万分之一,而从时间和经济成本考虑,这万分之一能够被处理的数据中真正被处理的又不到其百分之一。所以,那种在人工封闭环境中的“数据—信息—知识—智慧”模式就显得很苍白,很无力,很没有说服力。
1704600174
1704600175
其次,正因为世上万事万物都在被数据化,那么由此产生的数据形态就与原有物质形态相对应,数据之间的相关性、因果性和或然性都以原生态的形式呈现出来,成为原生态的信息。人们得到的数据不再是过去那种人工采集所得到的孤立、零碎、片面、带有明确目的性和主观性的东西,而是原生态的数据群落,既包括数据,也包括数据间的关系。那些体现同一主体的众多数据可以根据其内在联系成为时下被科学家们命名为“元数据”的东西。例如,一个人的全部网络行为记录数据,就构成其网络生活的全景图谱,没必要再去考证、推论、猜测才能得出结论。一个人的体温达到 38℃,同时其全面的身体状态数据也呈现出来,使得数据化诊断成为非常简单的事情。至于一个国家、一个具体领域,如果能够得到其动态、实时、全面的数据,那么,理解、分析、把握的事情也就不是什么了不起的工作。
1704600176
1704600177
再者,数据产生、存储、处理、传输和利用的人工设备不再仅仅是传统意义上的计算机,而是任何具备相同功能的人工制造物,例如手机、眼镜、手表、衣物、汽车、飞机、机床等,更不用谈数以十亿计的各种传感器。据专业机构预测,到 2020 年,世界上各种各样的数据终端总数将超过 500 亿。同样,和数据打交道的人也不再仅仅是数量有限的专家,而是绝大部分人类。获得数据的目的不再仅仅是科学兴趣或专业需求、获得知识和智慧的途径,而是日常生活的一部分。数据化生活不仅仅是在个人层面,而是在企业、机构、组织层面,进而在国家层面都具有了不可或缺的意义。如果说在过去,知其然,不知其所以然,是用来嘲讽一些人的浅薄无知,那么,在大数据时代,对大多数人大多数事情而言,知其然足矣,何必一定要知其所以然?换句话说,获取数据的目的不再局限于为知识和智慧打基础,而成为空气和水一样的生活必需品。
1704600178
1704600179
最后,原生态的数据群落已经不能仅仅靠形式逻辑去分析推理,实时、动态、复杂相关的海量数据还需要非形式逻辑和概率分析。越来越多的专业人士开始把数据、信息、知识作为同义词使用,因为没有非数据化或不能数据化的信息,也没有非数据化或不能数据化的知识,即使是过去被人神秘化的所谓“智慧”,也在近年轰轰烈烈的人工智能发展中逐步被认知,被数据化,变为毫不神秘的一堆数据。过去,人类用了十年时间,将人类 DNA 数据化,使得生命过程不再神秘,数据化医疗保健成为可能。现在,美国和欧洲又分别启动了人脑数据化的十年项目,将人类思维机制和过程数据化,使“智慧”数据化。这样看起来,数据既是手段,也是目的,既是此岸,也是彼岸,“大数据”之大,意义便是如此。
1704600180
1704600181
简而言之,数据是信息,数据是知识,数据是智慧,数据是一切的一切。这应该令人兴奋,而不是恐惧。什么可知不可知,陈腐的观念在大数据面前不堪一击。而旧瓶装新酒,还在用过时的数据概念和认知理论套在大数据现象上,不仅无用,而且误导。
1704600182
1704600183
1704600184
1704600185
1704600187
大数据经济:大数据时代,互联网加法如何做? 2 大数据时代的游戏规则
1704600188
1704600190
导读
1704600191
1704600192
2012 年上半年,我陆续写了一组关于大数据现象的文章,发表在杂志和网络上。下半年,旅美专家涂子沛和英国学者舍恩伯格关于大数据的书相继出版。于是,网络业和 IT 业关于大数据的讨论多了起来,渐渐在社会上也流传开来。
1704600193
1704600194
时至今日,在如何定义大数据的概念问题上,还没有一个学界和业界的共识,还是瞎子摸象,自说自话。多数人把大数据看作是互联网上的一种现象,或是一种互联网技术,与云计算、无线互联网等概念并列使用。虽然提供大数据服务的公司已经很多,但还没有形成一个大数据产业。这并不奇怪,因为大数据时代刚刚开始,人们的认识和实践还难免受到与其关系密切的网络业和 IT 业的传承的影响,还不能比较抽象、前瞻、深入地分析和认识大数据现象,更不用说学界把大数据当作一个严肃的学术讨论对象,这恐怕是十年以后的事情了。
1704600195
1704600196
虽然认识还不到位,但并不妨碍人们的探索,这也符合一般规律,摸着石头过河,实践走在认识前面。大体上看,在大数据方面的第一波创新尝试大致集中在三个领域,即网络业、制造业和公共服务业,以及三者之间的互动融合。
1704600197
1704600198
网络业的大数据实践由浅入深可以分为四类。第一类是大数据技术的发展,例如数据标准化、存储、传输、加工、利用等方面的进步,以应对数据增长快、规模大、种类多的挑战。第二类是对现有网络服务所获得的相关数据进行挖掘,以提高服务效率和收益。第三类是对数据终端与应用之间、网络平台与应用之间以及各类服务之间进行数据标准化、通用化和关联化的努力,以求得综合服务效应,获得额外的收益。第四类是基于可获取的数据设计全新的产品和服务,或者取代现有类似服务,或者开辟网络服务新天地。相对而言,前两类还算不上严格意义上的大数据实践,只能视其为大数据的前期准备,为真正的大数据培养人才和技术能力。后两类是大数据创新的主流,但为时尚短,还没有突破性的大创新出现,需要三五年才可能见到成效。
1704600199
1704600200
比起网络业,制造业在大数据方面的创新进展要显著得多。第一类是以 3D 打印技术为代表的数据化制造方式正在以日新月异的速度发展,大至飞机汽车、高楼建筑,小至原子和 DNA 层级的新材料研制,数据化制造将很快成为制造业创新的主流。第二类是制造业产品的数据终端化,越来越多的工业制成品具备了互联互通、数据生成的功能,像手机一样可以生产数据、传输数据,依托数据维持运行。第三类是传统制造技术与流程的数据化,主要表现为自动控制和智能化生产,也就是所谓“工业 4.0”。
1704600201
1704600202
公共服务方向的大数据实践表现比较醒目的有三个领域。第一个领域是通过应用大数据技术提供国家安全和公共安全的服务。撇开政治和社会争议不谈,斯诺登事件显示了掌控巨大资源和权力的政府系统已经在大数据方面走到了大规模实战的程度。第二个领域是公共卫生与保健领域,在社会医疗保险和医疗成本监控方面已经出现了比较成熟的大数据应用,在数据化医疗保健方面,各种创新层出不穷,很可能带来传统医疗保健机制的革命性变革。第三个领域是金融服务业,传统上分门别类的金融服务,包括银行、保险、投资、理财等,有可能架构重组,形成以用户(包括机构与个人)为中心,以大数据为基础的综合性金融服务。
1704600203
1704600204
比较而言,网络业的大数据发展难度低一些,一是因为网络上的数据已经存在,挑战主要在如何利用;二是因为大数据需要的基础设施、技术能力和资本在网络业已经存在,挑战主要在如何创新;三是因为没有历史包袱,走向大数据不需付出过多的转型成本。
1704600205
1704600206
像制造业这样历史悠久的传统产业发展大数据难度比较大:一是惯性思维制约了创造性思维的产生,例如像苹果手机那样的智能手机居然不是在手机业产生,反倒要毫无手机制造能力的苹果公司先走一步;二是数据终端型的产品要能够做到成本可控、市场欢迎、收益良好需要漫长的试错过程和用户接受过程;三是大数据制造需要一批新人、新技术、新设备,需要淘汰大量旧人、旧技术、旧设备,这往往意味着企业重组甚至破产重生。
1704600207
1704600208
公共服务领域走向大数据,挑战不仅在于从事大数据公共服务的机构和个人,更在于全社会接受和适应大数据公共服务的决心和能力。一个全新的大数据服务往往意味着社会的权力重组、利益调整和运行机制的改变,意味着公民权利和文化的再定义,这需要一个社会具备开放的能力,结构弹性较强。对于像中国这样一个开始走向现代化,改革开放进程远未完成的发展中国家来说,面对大数据时代的新挑战,应当是一个相当艰巨、漫长的历史过程。长期停滞不前或者短暂的倒退恐怕难以避免。
1704600209
1704600210
1704600211
[
上一页 ]
[ :1.704600162e+09 ]
[
下一页 ]