1700502053
1700502054
Run;
1700502055
1700502056
运行上述程序后得到了非参数检验的结果,如图12-9所示。
1700502057
1700502058
1700502059
1700502060
1700502061
图12-9 多个独立样本组的Kruskal-Wallis检验结果
1700502062
1700502063
依据图12-9中的Kruskal-Wallis检验统计量对应的P值,即pr>Chi-Square<0.0001来看,在给定的显著性水平α=0.05的条件下,可知不同群体(Group)所反映的活跃度分数(Score)的总体位置是不相同的,即可以认为不同群体的活跃度分数是有明显差异的。
1700502064
1700502065
1700502066
1700502067
1700502069
数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.11 卡方检验
1700502070
1700502071
卡方检验(Chi-Square Test)也是一种应用非常广泛的假设检验方法,它属于非参数检验的范畴,主要是比较两个和两个以上的样本率(构成比例),以及对两个分类变量的关联性进行分析,其根本思想是比较理论频数和实际频数的吻合程度或者拟合度。
1700502072
1700502073
关于卡方检验的原理和公式,本书在第8.6.5节已有详细介绍,在这里就不再赘述了。
1700502074
1700502075
示范案例:某公司运营部门根据用户的属性将用户分为5个不同的群体Segment,分别为a,b,c,d,e 5个群体,并从总体中提取5个群体中的一些样本,分别针对各个群体在过去30天内是否发生网上交易(Make-Deal)的记录进行统计,现在想知道不同群体之间发生网上交易的比例是否有明显的差别。
1700502076
1700502077
卡方检验在SAS中可以通过Freq过程来实现,本示范的具体程序代码如下:
1700502078
1700502079
Proc freq data=five;
1700502080
1700502081
Table segment*make_deal/chisq;
1700502082
1700502083
Run;
1700502084
1700502085
运行上述程序后得到卡方检验的结果,如图12-10所示。
1700502086
1700502087
1700502088
1700502089
1700502090
图12-10 卡方检验的结果
1700502091
1700502092
从图12-10的结果中可以看出,Chi-Square统计量的值为4.0133,其对应的P值,即Prob值为0.404 2,假定显著性水平α=0.05,则P值远远大于α,因此没有理由拒绝细分群体与是否成交之间相互独立的原假设,也就是说细分群体之间的成交情况没有明显的关联性。
1700502093
1700502094
1700502095
1700502096
1700502098
数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.12 控制变量的方法
1700502099
1700502100
除了上面谈到的这些基本的、常见的统计分析检验技术之外,在数据化运营的商业实践中,针对运营效果进行分析时还有一些重要的思路和策略,利用这些思路和策略来处理数据可以有效提升分析效率,更好、更准确地发现正确的结论。其中,最常见的一个思路和策略就是控制变量的方法。
1700502101
1700502102
所谓控制变量,是指在分析某个核心因素针对不同群体的运营效果时,为了防止其他因素的干扰,而人为地将考虑到的其他因素,即一些潜在的、重要的、可能影响运营效果的因素进行固化(或排除),从而在一个人为控制的比较单纯的数据中专门分析核心因素的影响。
[
上一页 ]
[ :1.700502053e+09 ]
[
下一页 ]