打字猴:1.70050205e+09
1700502050 VAR score;
1700502051
1700502052 Class group;
1700502053
1700502054 Run;
1700502055
1700502056 运行上述程序后得到了非参数检验的结果,如图12-9所示。
1700502057
1700502058
1700502059
1700502060
1700502061 图12-9 多个独立样本组的Kruskal-Wallis检验结果
1700502062
1700502063 依据图12-9中的Kruskal-Wallis检验统计量对应的P值,即pr>Chi-Square<0.0001来看,在给定的显著性水平α=0.05的条件下,可知不同群体(Group)所反映的活跃度分数(Score)的总体位置是不相同的,即可以认为不同群体的活跃度分数是有明显差异的。
1700502064
1700502065
1700502066
1700502067
1700502068 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497673]
1700502069 数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.11 卡方检验
1700502070
1700502071 卡方检验(Chi-Square Test)也是一种应用非常广泛的假设检验方法,它属于非参数检验的范畴,主要是比较两个和两个以上的样本率(构成比例),以及对两个分类变量的关联性进行分析,其根本思想是比较理论频数和实际频数的吻合程度或者拟合度。
1700502072
1700502073 关于卡方检验的原理和公式,本书在第8.6.5节已有详细介绍,在这里就不再赘述了。
1700502074
1700502075 示范案例:某公司运营部门根据用户的属性将用户分为5个不同的群体Segment,分别为a,b,c,d,e 5个群体,并从总体中提取5个群体中的一些样本,分别针对各个群体在过去30天内是否发生网上交易(Make-Deal)的记录进行统计,现在想知道不同群体之间发生网上交易的比例是否有明显的差别。
1700502076
1700502077 卡方检验在SAS中可以通过Freq过程来实现,本示范的具体程序代码如下:
1700502078
1700502079 Proc freq data=five;
1700502080
1700502081 Table segment*make_deal/chisq;
1700502082
1700502083 Run;
1700502084
1700502085 运行上述程序后得到卡方检验的结果,如图12-10所示。
1700502086
1700502087
1700502088
1700502089
1700502090 图12-10 卡方检验的结果
1700502091
1700502092 从图12-10的结果中可以看出,Chi-Square统计量的值为4.0133,其对应的P值,即Prob值为0.404 2,假定显著性水平α=0.05,则P值远远大于α,因此没有理由拒绝细分群体与是否成交之间相互独立的原假设,也就是说细分群体之间的成交情况没有明显的关联性。
1700502093
1700502094
1700502095
1700502096
1700502097 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497674]
1700502098 数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.12 控制变量的方法
1700502099
[ 上一页 ]  [ :1.70050205e+09 ]  [ 下一页 ]