1700502933
1700502934
1700502936
数据挖掘与数据化运营实战:思路、方法、技巧与应用 第17章 条条大道通罗马
1700502937
1700502938
天下同归而殊途,一致而百虑。
1700502939
1700502940
——《周易·系辞》(下)
1700502941
1700502942
17.1 为什么会条条大道通罗马
1700502943
1700502944
17.2 条条大道有侧重
1700502945
1700502946
17.3 自觉服从和积极响应
1700502947
1700502948
17.4 具体示例
1700502949
1700502950
对于数据分析师来说,数据分析和挖掘工作不仅仅是一个赖以生存的行业,它还是美和智慧的化身。
1700502951
1700502952
说它美,是因为它一半是科学,一半是艺术。对于优秀的数据分析师而言,面对一个分析课题,对思路的权衡,对算法的取舍,如何妙笔生花地创造出有效的衍生变量,如何无中生有地从杂乱无章的海量数据中提炼出珍贵的商业规律和应用方案等,所有这些跟艺术家的艺术创作没有任何本质上的区别。
1700502953
1700502954
说它智慧,是因为它浓缩了人生与社会中的诸多真理。且不说数据分析师应该具备的信念、信心、热情、敬畏、感恩也是人生成功的核心品质,且不说“没有最好,只有更好”的模型优化宗旨也是人生不断上进的方向,单看条条大道通罗马,就可以给人无限的启迪和想象。在此条条大道通罗马是指任何具体的分析专题、分析需求,都至少有两种以上的不同思路和技术方案可以加以有效地解决。本章将围绕数据分析(挖掘)工作中条条大道通罗马的有趣现象,进行深入分析,以帮助大家选择最合适的大道、最具性价比地去实现分析目的。
1700502955
1700502956
1700502957
1700502958
1700502960
数据挖掘与数据化运营实战:思路、方法、技巧与应用 17.1 为什么会条条大道通罗马
1700502961
1700502962
之所以会出现条条大道通罗马的现象,主要是因为事物是普遍联系的,具体包括以下内容:
1700502963
1700502964
❑不同的思路之间是普遍联系的。以用户行为特征专题分析为例,既然分析目标是找出用户的行为特征,那么不论是什么思路,其最终目的一定是围绕分析目标的。你可以从用户历史行为数据之间的分布中看出明显的区别,也可以从用户调研中发现典型特征,还可以把用户细分成不同的群体(从商业应用的角度来细分),然后看不同群体间的特征、区别等。不同的人有不同的思路,优秀的数据分析师常常有多个思路。同样的目标,可以横看成岭侧成峰,所有这些思路上的普遍联系使得数据分析中的条条大道通罗马不仅是可能的,更是必然的。
1700502965
1700502966
❑不同的算法之间是普遍联系的。还是以用户行为特征专题分析为例,不管你用什么算法(聚类算法,或者是决策树算法、假设检验算法、逻辑回归算法),不同的算法虽然看起来技术不同,但是在应用到这个具体的用户行为特征专题时,都是在努力区分哪些是与其他字段(行为)有最明显区别的核心字段。在聚类算法中,这些核心字段是用来有效区分用户与非用户的;而在决策树算法中,这些核心字段是为了让满足这些字段要求的群体尽量纯,尽量排除非用户,或者大幅减低非用户在这些群体中的比例;在假设检验算法中,这些核心字段就是用于找出用户与非用户最有显著意义的特征区别的;在逻辑回归的算法中,则是尽量发现哪些字段可以最有效地区分用户与非用户。所以,算法的不同只是实现结果的方式不同,但是其目的都是一样的,这就是所谓的殊途同归、条条大道通罗马。
1700502967
1700502968
❑数据本身是普遍联系的。无论是海量的互联网数据,还是积累不多的传统行业数据,甚至是每个人自身的生理指标数据,都不是孤立的,而是普遍联系的。你的身高、体重,仅是两个最简单的指标,就可以在很大程度上通过你是否超重来判断你患高血压的可能性,而舒张压和收缩压的指标也可以判断出你患高血压的可能性,你不觉得身高、体重与舒张压、收缩压之间有密切的联系吗?正因为数据本身是普遍联系的,才使得我们在分析数据的时候,虽然考虑的思路不一样、抽取的数据不太一致,但是最后完全有可能得到相同的答案。
1700502969
1700502970
1700502971
1700502972
1700502974
数据挖掘与数据化运营实战:思路、方法、技巧与应用 17.2 条条大道有侧重
1700502975
1700502976
尽管条条大道通罗马是事物发展的普遍规律,也是数据分析中的普遍规律,但是毕竟这些大道并不相同。因此,矛盾的普遍性之中也蕴含着矛盾的特殊性。通往罗马的条条大道,有远近的不同,有路况的不同,有配套设施的不同,有匹配场景的不同,每条大道都有最适合它的通行模式和交通手段。对于数据分析师来说,针对具体的分析专题,一方面要笃信条条大道通罗马,尽量用不同的思路去思考、去权衡;另一方面,在知己知彼的情况下,要能正确地选择最适合的思路和方法去解决问题。
1700502977
1700502978
如何去选择最适合的思路和方法呢?提供几点参考意见如下:
1700502979
1700502980
❑对具体分析专题的目标需求进行思考。同样的分析专题,比如付费用户典型特征分析,除了会有不同的分析需求外,对分析结论也会有不同的要求,如对结论的精度有要求,对结论的时效性有要求,对完成的时间有要求,对结论的真实性有要求等。举个例子,对于运营过程中临时性的付费用户典型特征分析需求,会对分析结论的时效性要求高,因为希望能尽快提炼出来支持运营;而对于产品优化和开发用途的付费用户典型特征分析,却对分析结论的准确性和全面性要求高,希望这些结论作为下阶段产品优化和产品开发的依据,因此思考的维度要更全面、更深入,可以适当延长分析时间。很明显,上述两种场景,虽然都是针对付费用户的典型特征分析,但是因为各自的要求和侧重点不同,分析师所采用的思路和技术也应该相应有所侧重。前者或许通过简单的透视表就可以达到目的,后者则要经过用户调研,加上使用效果跟踪分析,预测模型的思路,而且所用的时间周期会比较长,这样得出的结论才比较全面、深入。总之,尺有所短寸有所长,思路和技术本身没有好与坏,只有是否合适之分。
1700502981
1700502982
❑对分析需求的商业价值进行思考。正如预算永远是不足的一样,企业的数据处理资源和数据分析资源在面对企业无尽的分析需求时也是永远不够的。有限的资源只能投放到最有商业价值的分析专题和分析工作中。同样的道理,根据不同分析需求的商业价值的大小,合理安排分析资源和分析方案,也是数据分析师在选择不同思路和技术时要思考的内容。
[
上一页 ]
[ :1.700502933e+09 ]
[
下一页 ]