1700501649
关于聚类技术本身的详细介绍,在第9章已经做了详细介绍,这里就不再重复讲解了。针对聚类技术在用户特征分析中的具体应用,需要强调的是,如果参与聚类的变量数量较少,为了能够更好地支持用户特征分析的实践应用,非常有必要在聚类(分群)的基础上,增加更多的与业务目标和商业背景相关的非聚类变量来进行综合考虑。
1700501650
1700501651
举例来说,在一个针对某产品付费用户的细分项目中,要把付费用户细分成特征区别明显的几个群体,如果采用聚类分析技术进行分析,参加聚类的字段只限于累计购买金额、产品重复购买次数、加入会员俱乐部的年限等3个核心指标。经过聚类分析后,可以将付费用户细分成6个相互之间区别比较明显的细分群体。然后,在上述细分基础上,针对每个细分群体,还可以进一步分别考察其他的字段和指标,找出其他的特征字段。比如A群体,除了聚类分析找到的特征“累计购买金额大于2000元,基本上没有重复购买,加入会员俱乐部年限为1年以内,”通过对其他字段的考察,发现该群体还具有都购买过P4P产品、年龄在30岁以下、主营行业都是服装服饰等特征。很显然,增加了新的特征之后,该群体的典型特征就更加丰满、更加深入了,由此会为业务方的分析、运营、管理提供更多的方向、更深的了解、更全面的信息。
1700501652
1700501653
1700501654
1700501655
1700501657
数据挖掘与数据化运营实战:思路、方法、技巧与应用 11.2.4 决策树技术的应用
1700501658
1700501659
关于决策树的原理和在预测模型中的注意事项,在本书第10.2节中已进行了详细的介绍。
1700501660
1700501661
决策树技术最大的应用优势在于其结论非常直观易懂,生成的一系列“如果……那么……”的逻辑判断,很容易让人理解和应用。这个特点是决策树赢得广泛应用的最主要原因,真正体现了简单、直观、通俗、易懂。
1700501662
1700501663
借助决策树技术的上述应用优势,那些典型的“如果……那么……”的业务规则(规律)是很容易转化为用户特征分析的典型结论和典型特征的。
1700501664
1700501665
1700501666
1700501667
1700501669
数据挖掘与数据化运营实战:思路、方法、技巧与应用 11.2.5 预测(响应)模型中的核心自变量
1700501670
1700501671
借鉴预测(响应)模型的思路和做法,通过搭建预测模型可找出对预测目标变量最有价值的输入变量及其权重,然后针对这些筛选后的少数变量进行用户分群划分,就形成了一个比较有效的思路和方法,可以提高用户特征分析工作的效率和产出。具体关于预测(响应)模型的搭建技术和思路可以参考本书第10章。
1700501672
1700501673
在此要强调的是,如果想要使用预测模型的思路和做法,那么要注意模型本身的目标变量应该是与用户特征分析中的业务需求(商业目的)保持一致的。比如,用户特征分析中的商业目的是找出续费客户的典型特征,那么在借鉴预测模型的思路和做法时,模型的目标变量就应该与用户特征分析中的商业目的保持一致,也即模型的目标变量应该也是是否续费。
1700501674
1700501675
反过来说,如果用户特征分析的商业目的很难用预测模型的目标变量来定义,那么就无法借鉴预测模型的思路和做法了。比如,用户特征分析中的商业目的是针对某产品的试用用户群体进行群体细分,找出明显特征区别的细分群体,因为试用用户是随机产生的,不是从一个特定群体里通过某种运营或机制产生的,所以在这个业务场景中,是无法找到合适的目标变量来尝试预测模型的思路和做法的。在类似的业务场景中,进行用户特征分析时就只能想其他的方法了。
1700501676
1700501677
1700501678
1700501679
1700501681
数据挖掘与数据化运营实战:思路、方法、技巧与应用 11.2.6 假设检验的应用
1700501682
1700501683
假设检验作为现代统计学的基础知识,在数据分析挖掘中占有非常重要的基础地位,本书在第12章将对假设检验进行比较深入的讲解,所以本章就不再深入介绍其原理和具体技术了。
1700501684
1700501685
通过假设检验来筛选有显著性差异的核心变量,是用户特征分析应用中选择特征字段的一个有效方法。但是,这种方法需要数据分析师对于业务和数据非常了解,能从众多的数据字段中比较有效地发现、提炼出为数不多的那些最可能是有显著性区别的核心字段,这些核心字段能够显著区别不同群体的典型特征,然后对这些潜在的重点字段通过假设检验去一一验证,看是否真的是可以显著区分不同群体。
1700501686
1700501687
1700501688
1700501689
1700501691
数据挖掘与数据化运营实战:思路、方法、技巧与应用 11.3 特征提炼后的评价体系
1700501692
1700501693
用户特征分析的结论(典型特征)出来之后,在落地应用之前,数据分析师自己需要对分析结论做基本但是却很重要的评估。虽然说落地应用的效果跟踪是最重要的评估方法,但是为了避免资源浪费,也为了在前期有个初步的评价和过滤,数据分析师自己可以采用以下评价体系(思路)对分析结论进行基本的评估:
1700501694
1700501695
❑结论(典型特征)是否与当初的分析需求(商业目标)相一致。很多时候,随着分析的深入,分析方向有可能逐渐偏离原定的商业目标,由于数据、变量的不断增减,或者新的发现更吸引人等原因,导致数据分析师需要经常检视当前的进度或者结论是否与当初的分析需求相一致。
1700501696
1700501697
❑结论是否容易被业务方理解,是否容易特征化。结论在业务中的可理解性和易解释性是数据分析挖掘成果能否得到有效落地应用的关键因素之一,因为数据化运营是多个团队协同的工作,不是数据分析团队单打独斗可以包办的,如果结论不容易被业务方理解和认同,是谈不上在业务方有效落地应用的。这一点不仅适用于用户特征分析的结论,还适合所有的数据分析挖掘课题结论和课题成果。
1700501698
[
上一页 ]
[ :1.700501649e+09 ]
[
下一页 ]