打字猴:1.70049933e+09
1700499330 数据挖掘与数据化运营实战:思路、方法、技巧与应用 5.3 技术尖端论
1700499331
1700499332 “技术尖端论”也是数据分析师,尤其是年轻的刚接触数据分析应用的数据分析师里比较有代表性的一种错误观念和思想。持有这种观念的分析师,会过分追求所谓尖端的、高级的、时髦的、显示自己技术水准的数据分析挖掘技术,认为分析技术越高级越好,越尖端越厉害。在数据分析项目实践中的主要表现就是面对一个分析课题,持“技术尖端论”的分析师首先想到的是选择一个最尖端的、最高级的分析技术去解决,而不是从课题本身的真实需求出发去思考最合理、最有性价比的分析技术。
1700499333
1700499334 任何一个数据分析课题,至少都会有两种以上的不同分析技术和分析思路。不同的分析技术常常需要不同的分析资源投入,还需要不同的业务资源配合,而产出物也有可能是不同精度和不同表现形式的。这其中孰优孰劣,根据什么做判断呢?是根据项目、课题本身的需求精度、资源限制(包括时间资源、业务配合资源、数据分析资源投入)等来做判断和选择,还是按照分析技术的高级与否做判断和选择?不同的考虑方式和选择结果,决定着项目的资源投入和对业务需求满足的匹配程度,一味选择尖端的、高级的算法和分析技术很可能会造成项目资源投入的浪费,并且很可能不是最适合业务需求的方案。最贵的,不一定是最适合你的,我们在生活中的体验和感悟同样也是适用于数据分析课题的场景和数据化运营应用的。
1700499335
1700499336 举一个实际的案例来说明。如某在线新产品上线试运营了两个月,产生了一批付费购买的用户,现在产品运营团队希望能比较深入、全面地了解目标用户的基本特征和大致的群体规模。针对这个分析需求,基于当前的业务背景(刚刚上线运营两个月)应该用什么样的分析思路和分析技术呢?目标用户特征群体筛选课题的解决思路,至少有3种以上的分析技术可以完成:有简单的技术,如统计描述总结、相关性分析、假设检验等;有常规的技术,比如聚类分析等;也有更加需要资源投入的技术,比如针对单个目标用户的预计付费概率的预测模型。具体到本案例,由于产品刚刚上线运营两个月,业务方对目标用户的大致情况还没有一个详细、全面的了解,而且无法使用精确的付费概率预测模型(2个月的数据很难完全支撑起一个有效的预测模型的搭建和验证),所以综合考虑,简单地统计描述总结,进行相关性分析和假设检验是现阶段、现有业务背景下比较具有性价比的优选思路和解决办法。
1700499337
1700499338 追求技术的进步和发展本身没有错,但是一味强调技术的先进性,忘记了业务因素对分析课题的决定性影响,忘记了数据分析工作的目的是为业务服务、满足业务需求的根本宗旨,实际上就是本末倒置、舍本逐末,其实践后果通常就是浪费了分析资源,或者丢掉了最佳性价比的方案,或者根本无法与真实的业务需求有效对接。
1700499339
1700499340 应对并防止“技术尖端论”的一些有效的管理措施和管理制度包括5.2节谈到的课题需求评估机制,即用专家集体的力量提炼出最合适的、最具性价比的分析思路和技术,以及经常性的分析师团队的技术分享,如项目课题分享、同行间的课题交流,从不同的实际案例中深刻体会如何权衡分析思路、为什么“适用性”比“尖端性”更好、为什么“性价比”的考虑比单纯的“技术性高低”的考虑更可靠更有意义,从而逐渐开阔分析师的思路和视野,丰富分析师的经验。
1700499341
1700499342
1700499343
1700499344
1700499345 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497533]
1700499346 数据挖掘与数据化运营实战:思路、方法、技巧与应用 5.4 建模与应用两段论
1700499347
1700499348 “建模与应用两段论”在当前的企业数据化运营实践中比较普遍,相当数量的数据分析师都自觉或者不自觉地在工作中表现出“两段论”的现象,比如不少数据分析师一旦将模型搭建好并验证通过之后,就将之丢给业务方去应用,至于业务方具体应该如何应用模型,数据分析师不太关心。又比如,模型或数据分析结论、方案在业务应用中出现了问题或瓶颈,但是相关的数据分析师不愿意去主动进行分析、诊断,或者不太清楚如何找出造成业务落地应用困境的原因,只能将这些问题和困难丢给业务落地应用方自己去摸索。
1700499349
1700499350 “建模与应用两段论”的背后既有分析师自身对业务背景了解不足、业务知识欠缺,或者业务经验不够的原因,又有分析师“偷懒,多一事不如少一事”的心态在作怪,也就是“不负责任”的态度在作怪,就是不能真正有效支持业务需求,最终致使其不能落地应用。更深层次的原因也可能来源于企业管理层、决策层对于数据分析团队的定位和认识比较简单肤浅,对于数据化运营和数据挖掘应用的看法比较落后(如果数据分析团队和数据分析师被认为仅仅是企业里的一个部门、一个分析的职能,“铁路警察,各管一段”、“分析师出模型,业务方管应用”似乎也就顺理成章了)。
1700499351
1700499352 一个复杂的挖掘模型也好,一份数据分析报告也罢,对于企业的数据化运营的应用场景来讲都只是万里长征第一步。要真正给企业带来价值,重点在于其后的业务落地应用环节,这个环节比单纯的数据分析和数据建模更复杂、更关键,它需要多团队多专业的协调和配合,离不开数据分析师(数据分析团队)持续地跟踪、讨论、修正、建议。如果数据分析师不能参与落地应用环节,可以肯定地说这个业务落地应用的效果不会好到哪里去。因为除了单纯的模型方案之外,业务应用团队还需要了解数据建模的思路、数据分析师具体的提醒、业务落地应用中碰到困难时分析师的及时诊断和建议、应用效果评估时分析师给出的合理评估思路和评估框架等。更重要的是,数据分析(挖掘建模)过程绝不是简简单单的一蹴而就的过程,很多时候它是一个要通过与业务方的讨论、沟通,不断修正不断完善的过程。脱离了应用中的及时沟通、讨论、反馈、修正,这个模型也不可能有多大的业务应用价值,这样的数据挖掘模型(或者数据分析报告)也没有什么大的价值和意义。
1700499353
1700499354 应对和防止“建模与应用脱节”的有效管理措施包括:对于数据分析师的考核和考评不是基于模型(或者分析报告和建议)本身,而是基于模型(项目)业务落地应用后的实际效果和业务反馈,这种考核制度促使数据分析师必须全程参与项目应用(数据化运营),从而显著减少“建模与应用脱节”的可能性;另外,上面几节谈到的分析师管理的实线和虚线的“双线主管”制度也可以有效督促数据分析师加强分析与应用的结合性,确保分析、建模真正来源于业务需求,并真正有效服务于业务需求。
1700499355
1700499356
1700499357
1700499358
1700499359 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497534]
1700499360 数据挖掘与数据化运营实战:思路、方法、技巧与应用 5.5 机器万能论
1700499361
1700499362 “机器万能论”的主要特点就是在建模过程中,认为机器(分析软件)是可以最大程度(甚至几乎可以完全)代替分析师手工劳动,于是,即使在很多关键的需要人工介入的步骤和节点,数据分析师仍然简单、轻率地交给机器去处理,盲目、过分地依赖机器的“智能”。其主要的表现形式就是,数据分析师拿了一堆分析数据,不加任何处理(或者只做了简单的处理)就交给机器(分析软件)去自动完成模型搭建,然后直接拿这个去交差,提交业务应用。
1700499363
1700499364 “机器万能论”背后的原因主要在于数据分析师自身对于数据挖掘技术、数据分析技术的理解和掌握不熟悉、不透彻,对于挖掘技术和分析技术的把握还是很粗糙,或者是浅尝辄止,分析技术层面的基本功不扎实。在数据挖掘项目中,80%的时间是花在数据的熟悉、清洗、整理、转换等数据处理阶段的,在这个阶段虽然机器(分析软件)可以大量取代分析师手工进行规范化的、重复性的工作,但是仍然有相当多关键性的工作是需要分析师手工进行的,比如机器最多可以告诉你数据的分布统计特征、变量之间的相关性,但是背后隐藏的是什么样的业务逻辑,如何取舍这些变量等核心的问题是需要分析师去判断去决定的(机器在这时是无能为力的);又比如,现在很多分析(挖掘)软件都有默认(Default)的参数设置,但是实际上这些默认的设置并不能有效符合任何一个特定的、具体的数据分析课题场景。因此在具体的数据建模过程中,各种算法的参数如何设置,选择哪种算法最合适等这些重要的问题,都是需要数据分析师凭借自己的专业水平和项目经验去作出判断和决定。另外,即使是经验丰富的优秀数据分析师,在层出不穷的新的业务需求和新的业务场景面前,也常常出现已有的经验、原理等无法有效解决新问题、新挑战的情况。在这种情形下,就更需要数据分析师从大量的分析数据里不断探索、尝试了,其中的过程有可能是耗时、曲折、充满艰辛的。
1700499365
1700499366 上述种种场景都说明了,数据分析和数据挖掘建模过程中,纵然有先进的分析(挖掘)工具,但是数据分析师人工的投入和判断仍然是必不可少的,我们经常需要手工进行探索。“机器万能论”不可取,不可信,更不可行。
1700499367
1700499368 任何事情要做好,都必须具有持续的热情和兴趣。没有热情和兴趣的驱使,就没有持久的深入钻研的动力,也就无法在一个领域、一个专业里得到快乐和干出成绩。数据分析师如果没有对于数据分析、数据挖掘的兴趣和热情,也就不可能深入钻研相关技术,很可能会简单轻松奉行“机器万能论”。把一切都交给机器(分析软件)去撞大运。虽然放手让机器去“万能”很轻松,但是其结果基本上都是不靠谱的、都是不能足够有效满足业务应用需求的。“有得必有失”、“付出才有回报”这些人间的正道,同样也是数据挖掘里的“正道”。
1700499369
1700499370 “机器万能论”的根源是对于分析、挖掘技术缺乏必要的理解和掌握,“因为不知如何下手,所以交给机器去代理”。无论有没有相应的管理措施,管理措施带来的效果都不如分析师找到自己对于数据分析、挖掘的热爱和兴趣的效果来得有效和彻底。管理的手段大多是被动的,只有主动的兴趣和热情才是更直接、更有效、更彻底摈弃“机器万能论”的良方,这也是为什么企业在招聘数据分析师的时候,要重点考察应聘者对于数据分析专业的兴趣和热情。
1700499371
1700499372 其实,岂止是数据分析领域需要从业者的专业兴趣和热情,人生一路的风景,哪一幕的精彩不是因为兴趣和热情所激发和创造出来的呢?
1700499373
1700499374
1700499375
1700499376
1700499377 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497535]
1700499378 数据挖掘与数据化运营实战:思路、方法、技巧与应用 5.6 幸福的家庭都是相似的,不幸的家庭各有各的不幸
1700499379
[ 上一页 ]  [ :1.70049933e+09 ]  [ 下一页 ]