1700501869
虽然两组观察值是各自独立的,但是每组观察值不一定来自正态分布的总体,同时两个独立样本组的方差也不一定相等,这时就不能采用独立样本的T检验了,而必须进行两组独立样本的Wilcoxon秩和检验。
1700501870
1700501871
两组独立样本的Wilcoxon秩和检验方式是比较两个独立组观察值的一种非参数检验。该检验结果类似于T检验的结果,该检验用于次序变量、区间变量和比例变量中。
1700501872
1700501873
还是以上述案例为例,假设案例的数据不满足T检验的前提条件,那么就应该采用两组独立样本的Wilcoxon秩和检验,在SAS中,可利用Proc Npar1way的过程语句来实现,程序代码如下:
1700501874
1700501875
Proc Npar1way data=Work.One WILCOXON;
1700501876
1700501877
Class group;
1700501878
1700501879
VAR score;
1700501880
1700501881
Run;
1700501882
1700501883
运行上述程序后得到两个独立样本进行Wilcoxon秩和检验后的结果,如图12-2所示。
1700501884
1700501885
1700501886
1700501887
1700501888
图12-2 两组独立样本的Wilcoxon秩和检验的结果
1700501889
1700501890
在图12-2中可以看到,Two-Sided pr>|Z|的值为0.011 1,小于α理论值0.05,所以有足够的理由拒绝原假设两个独立组的均值相等,也即两个独立组的活跃度分数的均值是不相等的。
1700501891
1700501892
需要强调的是,如果Two-Sided pr>|Z|的值大于α理论值0.05,则结论是两个独立组的均值没有显著差异,但是并不能说成两个独立组的均值相等。
1700501893
1700501894
1700501895
1700501896
1700501898
数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.6 配对差值的T检验
1700501899
1700501900
在数据化运营的实践应用场景中,进行配对组样本的比较时,一般是对样本运营前后的情况进行对比,比如针对运营前后的网站活跃度进行对比,通过T检验,来判断运营活动是否明显提升了样本人群的网站活跃度。
1700501901
1700501902
对配对组差值进行T检验的条件类似于独立组样本的T检验的条件,其中包含以下两个条件:
1700501903
1700501904
❑每对观察值与其他观察值之间相互独立。
1700501905
1700501906
❑配对差值来自正态分布。
1700501907
1700501908
由于是配对差值的检验,所以配对差值T检验只用于区间以上的变量。
1700501909
1700501910
示范案例:某公司运营团队从某个细分客户群体中随机抽取一部分客户进行有针对性的“旨在提升其网站活跃度”的专题运营活动,在为期两周的专题运营活动结束后,收集参与活动的客户运营前后的网站活跃度分数,希望通过数据分析来判断该专题运营活动的提升效果是否显著。
1700501911
1700501912
配对差值T检验在SAS中采用PROC Univariate过程来实现,本示范案例的具体程序代码如下:
1700501913
1700501914
Proc UNIVARIATE data=two;
1700501915
1700501916
VAR diff;
1700501917
1700501918
Run;
[
上一页 ]
[ :1.700501869e+09 ]
[
下一页 ]