打字猴:1.700501897e+09
1700501897 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497668]
1700501898 数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.6 配对差值的T检验
1700501899
1700501900 在数据化运营的实践应用场景中,进行配对组样本的比较时,一般是对样本运营前后的情况进行对比,比如针对运营前后的网站活跃度进行对比,通过T检验,来判断运营活动是否明显提升了样本人群的网站活跃度。
1700501901
1700501902 对配对组差值进行T检验的条件类似于独立组样本的T检验的条件,其中包含以下两个条件:
1700501903
1700501904 ❑每对观察值与其他观察值之间相互独立。
1700501905
1700501906 ❑配对差值来自正态分布。
1700501907
1700501908 由于是配对差值的检验,所以配对差值T检验只用于区间以上的变量。
1700501909
1700501910 示范案例:某公司运营团队从某个细分客户群体中随机抽取一部分客户进行有针对性的“旨在提升其网站活跃度”的专题运营活动,在为期两周的专题运营活动结束后,收集参与活动的客户运营前后的网站活跃度分数,希望通过数据分析来判断该专题运营活动的提升效果是否显著。
1700501911
1700501912 配对差值T检验在SAS中采用PROC Univariate过程来实现,本示范案例的具体程序代码如下:
1700501913
1700501914 Proc UNIVARIATE data=two;
1700501915
1700501916 VAR diff;
1700501917
1700501918 Run;
1700501919
1700501920 客户的前后活跃度分数的数据集存放在two表中,其前后活跃度分数的差值定义为diff。
1700501921
1700501922 上述程序运行后得到对配对差值进行T检验后的结果,如图12-3所示。
1700501923
1700501924
1700501925
1700501926
1700501927 图12-3 配对差值的T检验的结果
1700501928
1700501929 从图12-3的T检验结果可以看出:
1700501930
1700501931 Student’s t(T检验),pr>|t|的值为0.0017,远远小于α理论值0.05,所以有足够的理由拒绝原假设(即配对差值与0的差别不明显),也即配对差值明显不为0。
1700501932
1700501933 如果pr>|t|的值大于α理论值0.05时,则没有足够的理由拒绝原假设,即配对差值与0的差别不明显,结论是配对差值与0的差别不显著,但是并不能说配对差值明显为0。
1700501934
1700501935
1700501936
1700501937
1700501938 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497669]
1700501939 数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.7 配对差值的非参数检验
1700501940
1700501941 如果每对观察值与其他观察值相互之间是独立的,但是每组观察值不一定来自正态分布的总体,这时就不能采用配对差值的T检验了,而必须进行配对差值的Wilcoxon秩和检验。
1700501942
1700501943 还是以上述配对差值T检验的案例来进行说明,针对配对差值的Wilcoxon秩和检验过程如下。
1700501944
1700501945 在SAS中,配对差值的Wilcoxon秩和检验仍然是采用PROC Univariate过程来实现的。但是观察的指标不同。
1700501946
[ 上一页 ]  [ :1.700501897e+09 ]  [ 下一页 ]