1700510290
这就好比一位画师给甲画像,然后把画像给乙、丙、丁等人观看,并宣称这幅画像惟妙惟肖、细节逼真。如果乙、丙、丁要判断画师的话是不是正确,评价画师的画功是不是如其所说,要么拿一张甲的照片来对比,要么直接把甲叫到面前来观察,只有这样才能真正用应验性的方法来对画师作出评价。次之的选择就是看这位画师过去画过多少肖像画,人们对其画功的赞誉有多少,将这些内容作为评价先验概率和似然度的条件,通过这种方式来判断“画像惟妙惟肖”是否有很高的置信度。
1700510291
1700510292
在数据分析场景中,同样有这样的问题。即使有同样的数据,同样的知识背景,不同的分析师也有可能得出不同的分析结果。哪种结果和事实更接近?没有人能够在最终的事实出现之前下结论。然而,在这种情况下,有着丰富经验和极好“历史战绩”的分析师给出的结论通常更有置信度。但我要强调的是,即使如此,也不能在分析结论被验证之前就说某位分析师的结论一定是对的,这才是困惑所在,也会直接或间接影响决策的实施。下面我们就会讨论决策的实施问题。此外,分析的边界是什么,分析到什么程度才算可以?对于这个问题,不同的流派也持有不同的观点。
1700510293
1700510294
我的观点是这样的。在以因果关系为导向的分析场景中,我们所做的事情实际上是在解开一个个“黑盒子”。我们把一个事件A当成“因”,把另一个事件B当成“果”,那么事件A与事件B的关系本身就是一个“黑盒子”。当挖掘得到一定成果,发现了事件A和事件B的关系后,这个“黑盒子”就被打开,变成了两个更“小”的“黑盒子”,即事件A’ 和事件B’。然而,一般作为“因”的事件A’ 会更吸引人们的注意。我们会再打开A’ 的“黑盒子”,看看是什么导致了事件A’——解开后可能是两个更“小”的“黑盒子”。这种逻辑层面的深入研究是无法说清回溯尽头的。通常将分析边界划定在人们目前能够清晰感知的地方就够了,不必探求过深。
1700510295
1700510296
举个例子,玻璃棒和丝绸摩擦后,二者都会对轻小物体有吸引作用。通过研究发现:这种摩擦可以使丝绸带负电荷,使玻璃棒带正电荷;带有相同电荷的物体互相排斥,带有不同电荷的物体互相吸引。这种现象就是静电感应现象。带有正电荷的物体甲在与不带电的物体乙靠近时,甲所带的正电荷会排斥乙所带的正电荷,使其向远离甲的方向移动,同时吸引乙所带的负电荷向靠近甲的方向移动,从而形成吸引现象。到这里,第一个“黑盒子”已经解开了。至于为什么电荷同性相斥、异性相吸,则是下一层“黑盒子”。如果还是在经典物理学的范围内,就大可不必往下研究了,或者等到理论基础足够从下一级的层面来解释时再进行研究。也有一些问题确实神奇而精妙,总会让我们感觉到有一个人类在认知上不容易迈过去边界。在这种情况下,也可以不迈过边界——只要当前的理论体系确实足够完善,能够解决眼下的问题就好。
1700510297
1700510298
1700510299
1700510300
1700510302
数据科学家养成手册 16.9 本章小结
1700510303
1700510304
数据可视化与分析是整个大数据落地过程中较为靠后的环节,通常伴随着很多的配色技巧、展示技巧,以及分析人员自身的行业背景和从业知识。应该说,在整个决策制定之前,所有数据层面的产出都应该在这个环节进行充分的呈现。
1700510305
1700510306
数据可视化同样不是一个孤立的过程,其中就包括数据与人交互并帮助人认知数据的过程。作为分析的实施者,数据分析人员应该有丰富的行业背景知识,并且要了解数学、地理、物理、心理学等相关学科的知识。分析过程中引入的维度越多,分析的维度就丰富,分析出来的结论通常也就有着越好的视角和说服力。
1700510307
1700510308
说到底,数据可视化主要是为了迎合人类自身的阅读习惯,以及人类对颜色、条目的敏感性这些因素而进行的技巧性调整。
1700510309
1700510310
(1) 快速消费品(Fast Moving Consumer Goods,FMCG)是指使用寿命较短、消费速度较快的消费品。
1700510311
1700510312
(2) 乔治·A·米勒(George Armitage Miller,1920年2月~2012年7月),美国普林斯顿大学心理学教授,著名心理学家。
1700510313
1700510314
(3) 曾国藩(1811年11月~1872年3月),晚清重臣,近代政治家、战略家、理学家、文学家。
1700510315
1700510316
(4) 蒲丰(George-Louis Leclerc de Buffon,1707年9月~1788年4月),法国数学家、自然科学家。
1700510317
1700510318
(5) 投资回报率。
1700510319
1700510320
1700510321
1700510322
1700510324
数据科学家养成手册 第17章 数据决策
1700510325
1700510326
决策是所有组织及任何一个阶层的领导者都会做的事情,而且几乎天天在做。决策不限于在特定范围或者全体范围内获得重要决议,每个人时时刻刻都在做着决策。
1700510327
1700510328
决策是指决定的策略或办法。《韩非子·孤愤》第十一中谈到:“智者决策於愚人,贤士程行於不肖,则贤智之士羞而人主之论悖矣。”意思是说:“智者的计谋由愚蠢的人来评判,贤者的品德由不贤的人来衡量,那么品德好、有才智的人就会感到耻辱,而君主的论断也必然荒谬了。”这里的“决策”显然是指对策略或主张的评判。在人们做出各类行为的时候,实际上也在不断对这个行为的得失进行评价,然后决定是否实行。注意,这个过程不见得是开会,很可能是一瞬间在一个人的脑海中做出了评判,然后实施。
1700510329
1700510330
1700510331
1700510332
1700510334
数据科学家养成手册 17.1 决策就是“拍脑袋”
1700510335
1700510336
决策随处可见。拿着外卖菜单决定午餐的菜色,在大雨中举着伞小心翼翼地走过坑洼不平的道路,在网上看到一件漂亮的衣服然后决定购买,都是在做决策——通过判断方案的好坏来决定是否要实施。这个过程的本质是人类基于自身“价值观”做出的“趋利避害”的行为。这种“价值观”是人类自身的一种对于取舍的判断模型,“利”与“害”是人类自身拥有的对事物感触的结果,通俗地说就是“愉悦”和“痛楚”。
1700510337
1700510338
每一个神智正常的人都会具有类似却又各不相同的对“利”与“利益”的理解——有的重视金钱,有的重视名誉,有的重视交际,有的重视短期效益,有的重视长期效益,即使是吃一顿美餐、看一部有趣的小说或电影这种纯粹在情感上获得愉悦的效果,也是“利”最朴素的表现。
1700510339
[
上一页 ]
[ :1.70051029e+09 ]
[
下一页 ]