1704272270
1704272271
一旦企业将客户数据信息唯利己之用,效果就会适得其反。
1704272272
1704272273
三年来,众多的客户数据信息项目和其后的美国国家安全局事件令我们更加坚信:一旦企业将客户数据信息唯利己之用,效果就会适得其反。德国严苛的数据保护法律在某些方面是显得有些过时,某些规定过于死板和冗长,但是却能应对现在的局面。问题的关键在于,企业必须认识到,他们如果想要使用客户的信息,就必须得到客户的许可。
1704272274
1704272275
智能数据的原则之一是“赢得数据”。
1704272276
1704272277
客户的数据信息属于客户,应该由客户决定与哪家企业分享哪些客户数据信息。如果对产品使用确实有促进,客户会愿意与企业分享他的个人信息。如果客户感觉到,企业打着大数据的旗号,搜集一切他们能够取得的数据,目的就是为了有一天能够利用这些数据甚至变卖这些数据,那么客户自然会反应过激。
1704272278
1704272279
智能数据冠军企业不会选择在法律顾问的协助下,通过获得客户同意使用其个人信息的声明,来谋取使用客户信息的权利最大化。智能数据冠军企业会遵循这一原则来设置IT系统,即只存储确实能够为客户带来增值的数据。
1704272280
1704272281
从长期来看,这种数据使用态度会带来成功,因为只有秉持这种态度,客户才会愿意与企业分享数据。如果我们落实了这个前提条件,那么我们在本书中描述的情况就有可能实现。至此,一个流程闭环形成,这就是我们所说的智能数据:凭借更少的数据,取得更大的成果。
1704272282
1704272283
1704272284
1704272285
1704272287
智能数据:如何挖掘高价值数据 第一部分 从大数据向智能数据转变
1704272288
1704272290
第1章 深陷数据过载的愁云惨雾
1704272291
1704272292
“它无所不在,它无所不知,它的名字是大数据。”
1704272293
1704272294
——呆伯特,2012年7月
1704272295
1704272296
流感预测器也闹“流感”
1704272297
1704272298
2008年是大数据发展的重要一年,尽管当时几乎还没有人提出大数据分析这一概念。就职于在当时仍备受推崇的、雄心勃勃的搜索引擎供应商谷歌的一小撮数据科学家在《自然》杂志上发布了一种大数据应用的方法,即利用大数据(的检测功能)令地球上的人类更加健康(少生病)。科学家们将这种应用命名为GFT:谷歌流感潮(Google Flu Trends)。科学家们宣称,在不与医生沟通的情况下,谷歌可以预言美国境内的流感疫情暴发和地理传播路径。科学家们的预测速度比当时的监测部门美国疾病控制与预防中心(CDC)更快、更准确。
1704272299
1704272300
几十年来,为了实现对流感疫情的监测,CDC搜集相关医疗诊断报告后,能够据此推测出全国居民的健康状况,推测结果公布时间较现实情况有一周左右的延迟。基于这种推测结果,CDC则可采取相关的公共卫生控制措施,例如开展大规模的疫苗接种。谷歌的科学家们基于他们的数据库,找寻到了一种预测居民健康状况的更容易的方法:他们统计居民在搜索引擎中搜索例如“流感有哪些症状”或者“附近有哪些药房”等词条的频率,标记搜索人所在的地点,并将这些统计数据与以往的流感疫情情况比对修正。在2008年,聚合并定位数以百万计的流感相关的搜索信息仅需不到一夜的时间。此外这种研究也证实了与专家发放调查问卷询问的方式(在调查流感疫情时,专家指的就是医生)相比,基于搜索请求统计的分析方法在一定区域内可以得出更微观精细的预测结果。
1704272301
1704272302
“谷歌流感潮”是大数据分析大众媒介影响的一个突破。不仅仅是谷歌公司的员工爱引用“谷歌流感潮”这个案例去促使人们关注谷歌公司的社会价值,关注信息技术仿射问题的记者也终于可以捕捉到一个在智能数据应用方面确凿的、普惠的成功案例。Trendtagen趋势大会的主讲嘉宾操着惯用的“这仅仅是一个开始”的口吻,认为“谷歌流感潮”这个应用实例是基于实证的医学研究革命的开始。分析与商业智能软件公司的销售人员都表现得仿佛他们的公司也参与了编写GFT算法一样,他们是想给人一种感觉,就是他们公司的产品在商业领域能够创造奇迹,就如同谷歌流感潮在公共健康领域创造的奇迹一样。人们也不再质疑在数据驱动下实现的进步。大数据分析领域的三个重要原则,通过谷歌流感潮这一应用案例被大众知晓。
1704272303
1704272304
1.我们拥有的数据量,远比我们想象的多。我们必须寻找新的方法,更有效地使用数据。
1704272305
1704272306
2.通过这些数据,我们可以观察人们的行为,并识别发展趋势,这可以为我们(实时)提供一个更准确的现实图景,其准确程度优于我们之前任何一次通过调查获取认识的方式,因此,我们拥有了更好的决策基础。
1704272307
1704272308
3.我们不再需要探究原因,统计关系会告诉我们,我们需要了解什么。《连线》(WIRED)杂志前主编克里斯·安德森(Chris Anderson)在他的文章《理论的终结》中就提到了这一点。在一个由数据丈量的世界中,我们不再需要理论模型,反正这些理论模型也只能部分为我们阐释世界。如果我们拥有丰富的数据基础,数据自会为自己证言。
1704272309
1704272310
2013年对大数据来说是一个好年景。有人会说,对大数据的发展来说,2013年比2008年还重要,这个就要看我们选取哪些比较指标了——可以是全世界积累的数据量、人们在谷歌上对“大数据”词条的搜索量、跟大数据有关的IT项目投入,也可以是呆伯特漫画里提到大数据词条的次数(2012年第一次提到)。企业咨询顾问、趋势观察员、软件供应商把大数据字样印在彩旗上,画在表格里,在每次PPT(演示文稿)演讲中都会提到。2013年,几乎在德国所有的行业会谈、座谈会和企业战略会中都会提到大数据概念。高德纳咨询公司的“3V”定义(体量、速度、多样化)变成了聚会小圈子里的高雅谈资,不管这个定义到底对他们有没有实际用处,也不论他们到底有多深的IT知识储备,参加聚会的人都重复不停地谈论这一定义。
1704272311
1704272312
1704272313
1704272314
1704272315
简而言之,大数据这个专业术语成为数字化的标签,大数据之“伟大”如同这个概念本身所承载的数据量那样“海量”,也如同这个概念所承诺的那样宏大。当时,整个世界无可救药地中了大数据的“毒”。
1704272316
1704272317
对“谷歌流感潮”项目来说,2013年就没那么幸运了。2月,在《自然》杂志的新闻门户网站上刊登了一篇文章,文章指出,一度宣称能使世界变得更美好的大数据应用领域的典型案例“谷歌流感潮”预测结果出现误报,对一些流感疫情的发生率估计过高,另一方面又认为某些疫情根本不会发生。2009年1月的猪流感事件就属于后一种情况(实际发生,但GFT没预测出来)。
1704272318
1704272319
现在回想起来,“谷歌流感潮”的发展史也可以这样写,谷歌是那个时代在大数据应用领域第一个“吃螃蟹”的人,领先于同业。来自山景城(谷歌总部所在地)的数据工程师率先对外宣称他们可以预测流感趋势。但同时,他们也是第一批令公众失望的人。哈佛大学的一份学术研究报告认为“谷歌流感潮”事件是在对大数据分析整体进行炒作。这份报告中最重要的词汇是“Hybris”,这个词源于古希腊语,在德语中是“Selbstüberschätzung”,译为“傲慢”,即指“大数据傲慢”。2014年4月,《经济学人》杂志刊登了《对大数据的抨击》一文。《纽约时报》在大篇幅的分析文章中提出了“8个(不对,是9个!)大数据存在的问题”。剑桥大学公共风险认识学教授戴维·施皮格哈尔特(David Spiegelhalter)表述得更加直白,他认为以他的经验来看,大数据所承诺的种种,毫无疑问纯属胡说八道。
[
上一页 ]
[ :1.70427227e+09 ]
[
下一页 ]