打字猴:1.700501985e+09
1700501985 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497671]
1700501986 数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.9 单因素方差分析
1700501987
1700501988 单因素方差分析(One-Way ANOVA)主要研究单个因素对目标变量的影响,这种方式将通过因素的不同水平对目标变量进行分组计算,得到组间和组内方差,并利用方差比较对分组所形成的总体均值进行比较,从而对各总体均值相等的原假设进行检验。
1700501989
1700501990 示范案例:某公司运营团队计划对某一类特定客户群体进行不同内容的,旨在提升客户网站活跃度的运营刺激,不同的运营内容分别为a、b、c、d、e 5种方案。这时,将从上述客户群体中随机抽取一部分客户,然后将其分别分配到这5种不同的运营方案中。在为期两周的运营活动结束后,运营方希望通过数据分析来评价不同的运营方案,是否在客户的活跃度提升上有明显的差异。
1700501991
1700501992 在SAS中,单因素方差分析是通过ANOVA过程来实现的,本案例具体的程序代码如下:
1700501993
1700501994 Proc ANOVA data=three;
1700501995
1700501996 Class group;
1700501997
1700501998 Model score=group;
1700501999
1700502000 Means group/snk;
1700502001
1700502002 Means group/scheffe tukey;
1700502003
1700502004 Run;
1700502005
1700502006 上述程序运行后得到了单因素方差分析的结果,如图12-5~图12-8所示。
1700502007
1700502008 从图12-5可以看出:F检验的概率(pr>F)值为0.0062,远远小于α理论值0.05,所以可以拒绝H0,同时表明运营方案(或内容)不同,则客户的活跃度提升分数也不相同。
1700502009
1700502010
1700502011
1700502012
1700502013 图12-5 单因素ANOVA输出的结果
1700502014
1700502015 从图12-6可以看出,经过SNK方法检验,C组客户的活跃度分数与其他各组的客户活跃度分数有明显的区别。
1700502016
1700502017
1700502018
1700502019
1700502020 图12-6 单因素ANOVA的SNK(Student-Newman-Keuls)检验结果
1700502021
1700502022 从图12-7可以看出,经过Tukey方法检验,c组分数与a、b、d、e各组的分数差异明显。
1700502023
1700502024
1700502025
1700502026
1700502027 图12-7 单因素ANOVA的Tukey检验结果
1700502028
1700502029 从图12-8可以看出,经过Scheffe方法检验,c组与e、d组的分数差异非常明显。
1700502030
1700502031
1700502032
1700502033
1700502034 图12-8 单因素ANOVA的Scheffe检验结果
[ 上一页 ]  [ :1.700501985e+09 ]  [ 下一页 ]