1700501889
1700501890
在图12-2中可以看到,Two-Sided pr>|Z|的值为0.011 1,小于α理论值0.05,所以有足够的理由拒绝原假设两个独立组的均值相等,也即两个独立组的活跃度分数的均值是不相等的。
1700501891
1700501892
需要强调的是,如果Two-Sided pr>|Z|的值大于α理论值0.05,则结论是两个独立组的均值没有显著差异,但是并不能说成两个独立组的均值相等。
1700501893
1700501894
1700501895
1700501896
1700501898
数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.6 配对差值的T检验
1700501899
1700501900
在数据化运营的实践应用场景中,进行配对组样本的比较时,一般是对样本运营前后的情况进行对比,比如针对运营前后的网站活跃度进行对比,通过T检验,来判断运营活动是否明显提升了样本人群的网站活跃度。
1700501901
1700501902
对配对组差值进行T检验的条件类似于独立组样本的T检验的条件,其中包含以下两个条件:
1700501903
1700501904
❑每对观察值与其他观察值之间相互独立。
1700501905
1700501906
❑配对差值来自正态分布。
1700501907
1700501908
由于是配对差值的检验,所以配对差值T检验只用于区间以上的变量。
1700501909
1700501910
示范案例:某公司运营团队从某个细分客户群体中随机抽取一部分客户进行有针对性的“旨在提升其网站活跃度”的专题运营活动,在为期两周的专题运营活动结束后,收集参与活动的客户运营前后的网站活跃度分数,希望通过数据分析来判断该专题运营活动的提升效果是否显著。
1700501911
1700501912
配对差值T检验在SAS中采用PROC Univariate过程来实现,本示范案例的具体程序代码如下:
1700501913
1700501914
Proc UNIVARIATE data=two;
1700501915
1700501916
VAR diff;
1700501917
1700501918
Run;
1700501919
1700501920
客户的前后活跃度分数的数据集存放在two表中,其前后活跃度分数的差值定义为diff。
1700501921
1700501922
上述程序运行后得到对配对差值进行T检验后的结果,如图12-3所示。
1700501923
1700501924
1700501925
1700501926
1700501927
图12-3 配对差值的T检验的结果
1700501928
1700501929
从图12-3的T检验结果可以看出:
1700501930
1700501931
Student’s t(T检验),pr>|t|的值为0.0017,远远小于α理论值0.05,所以有足够的理由拒绝原假设(即配对差值与0的差别不明显),也即配对差值明显不为0。
1700501932
1700501933
如果pr>|t|的值大于α理论值0.05时,则没有足够的理由拒绝原假设,即配对差值与0的差别不明显,结论是配对差值与0的差别不显著,但是并不能说配对差值明显为0。
1700501934
1700501935
1700501936
1700501937
[
上一页 ]
[ :1.700501889e+09 ]
[
下一页 ]