打字猴:1.702646887e+09
1702646887 图6-3 1974年美国成年人按受教育年限和宗教派别分的对堕胎的接受程度(N=1481)
1702646888
1702646889 用与它们均值的偏差重新表示变量
1702646890
1702646891 除了绘制如图6-3那样的各变量之间的关系图之外,我们可以用另一个工具来使含交互项的模型中的系数更加容易解释——我们将连续型变量表示为与它们均值的偏差——就像在前一个预测词汇知识的例子中所看到的那样。这样做的好处是组效应(各虚拟变量的主效应)可以被解释为在因变量上的组间期望差异,其比较的基准是在间距变量层次上取均值的普通人。
1702646892
1702646893 在这里,它意味着用每个观测值减去样本均值的方法重新表示受教育年限(重新表示后的系数显示在表6-3的模型3′中。)这样截距项就是具有平均受教育年限的新教徒对堕胎态度的期望值(这里,受教育年限的均值是针对全体样本计算的,而不只是针对新教徒)。与每个虚拟变量有关的系数表示新教徒和具有平均受教育年限的某一类别在持堕胎合法观点上期望水平的差异。注意,与受教育年限有关的斜率(正如前面讲过的,它是新教徒受教育年限的效应)保持不变,像与交互项有关的系数一样;只有组截距项发生变化。然而,对系数的解释非常容易:我们看到在具有平均受教育年限的群体中,新教徒赞同6个堕胎项目中的约4个,犹太教徒增加1.5个,“其他宗教信仰群体”增加0.7个,而天主教徒减少约0.4个。我们也看到受教育年限每增加一年新教徒的期望赞同数增加0.155个,不信教的群体增加大约同样的数量,因为它们斜率的差仅为0.014;相比较而言,受教育年限对犹太教徒和天主教徒的影响极小,因为与新教徒斜率的偏差是负的且几乎与新教徒的斜率一样大。
1702646894
1702646895 检验额外的假设:强制系数为0或等价量
1702646896
1702646897 审视图6-3,我们或许想要推论对天主教徒和犹太教徒来说受教育年限对接受堕胎的态度没有影响,而受教育年限对新教徒和其他宗教信仰群体具有同样的影响。我们如何正式检验此推论是否正确?我们可以通过估计下面形式的方程回答此问题:
1702646898
1702646899
1702646900
1702646901
1702646902 这里,天主教徒是省略类别。为了了解此方程怎样表示该特定假设,我们可以分别重新写出每个宗教信仰群体的方程6.30。
1702646903
1702646904 对于新教徒:
1702646905
1702646906
1702646907
1702646908
1702646909 对于天主教徒:
1702646910
1702646911
1702646912
1702646913
1702646914 对于犹太教徒:
1702646915
1702646916
1702646917
1702646918
1702646919 对于其他宗教信仰群体:
1702646920
1702646921
1702646922
1702646923
1702646924 通过审视方程6.31至方程6.34我们可以很清楚地看到,在方程6.30的设定中,每个宗教信仰群体的截距项不同;对天主教徒和犹太教徒来说,受教育年限与接受堕胎的关系的斜率为0;对新教徒和其他宗教信仰群体来说,斜率是一样的。为了检验这种受约束的设定是否足以反映数据,我们不能计算模型3的R2相对模型3′的增量,因为两个模型没有嵌套关系:在约束模型中没有受教育年限的主效应。那么,应该怎么做呢?幸运的是,我们有一种解决此问题的方法。
1702646925
1702646926
1702646927
1702646928
1702646929 量化数据分析:通过社会研究检验想法 [:1702644762]
1702646930 量化数据分析:通过社会研究检验想法 比较模型的贝叶斯方法
1702646931
1702646932 我们可以使用比较模型的另一种方法,即贝叶斯信息准则(Bayesian Information Criterion,BIC),由统计学家Adrian Raftery在做对数线性分析时(1986)引入社会学文献,并在一篇发表在《社会学方法》(Sociological Methodology)上的重要文章中扩展至多种应用〔Raftery,1995a;也可见Gelman和Rubin(1995)的评论、Hauser鉴赏性的评论(1995),以及Raftery对两人的回应(Raftery,1995b),还有1999年2月的期刊——《社会学方法和研究》(Sociological Methods and Research),该期内容全部都是对BIC的评价〕。从某种意义上讲,BIC与传统的显著性检验的操作原则相反。它是似然比测量,即告诉我们基于数据,哪个模型最可能是真实的(关于最大似然估计的简要介绍,见附录12.B);相反,经典的推论告诉我们,基于理论模型(零假设),由抽样误差生成观测数据的可能性有多大。
1702646933
1702646934 BIC相比前面介绍的F检验有三个重要优点。第一,跟F比率不同,BIC可用来比较非嵌套模型。任何两个描述同一现象的模型都可以进行比较。第二,如果样本量足够大,事实上任何R2的增量都会是显著的,即使该增量很小且无实质重要性。BIC可以对大样本的影响进行校正。要生成特定的BIC值,对大样本R2增量的要求会比小样本大。因此,BIC反映出传统建议,即当样本大时应选择较小的概率值。第三,BIC使复杂模型处于不利位置。因此,如果要引入很多变量才能产生一定的R2增量,BIC比F检验更可能建议我们选择简单的模型。有几种具体计算BIC值的方法,这取决于所分析的特定统计量。要比较回归模型,我们可以用Raftery的方程26:
1702646935
1702646936 BICk=N[ln(1-R2k)]+pk[ln(N)]      (6.35)
[ 上一页 ]  [ :1.702646887e+09 ]  [ 下一页 ]