1702646900
1702646901
1702646902
这里,天主教徒是省略类别。为了了解此方程怎样表示该特定假设,我们可以分别重新写出每个宗教信仰群体的方程6.30。
1702646903
1702646904
对于新教徒:
1702646905
1702646906
1702646907
1702646908
1702646909
对于天主教徒:
1702646910
1702646911
1702646912
1702646913
1702646914
对于犹太教徒:
1702646915
1702646916
1702646917
1702646918
1702646919
对于其他宗教信仰群体:
1702646920
1702646921
1702646922
1702646923
1702646924
通过审视方程6.31至方程6.34我们可以很清楚地看到,在方程6.30的设定中,每个宗教信仰群体的截距项不同;对天主教徒和犹太教徒来说,受教育年限与接受堕胎的关系的斜率为0;对新教徒和其他宗教信仰群体来说,斜率是一样的。为了检验这种受约束的设定是否足以反映数据,我们不能计算模型3的R2相对模型3′的增量,因为两个模型没有嵌套关系:在约束模型中没有受教育年限的主效应。那么,应该怎么做呢?幸运的是,我们有一种解决此问题的方法。
1702646925
1702646926
1702646927
1702646928
1702646930
量化数据分析:通过社会研究检验想法 比较模型的贝叶斯方法
1702646931
1702646932
我们可以使用比较模型的另一种方法,即贝叶斯信息准则(Bayesian Information Criterion,BIC),由统计学家Adrian Raftery在做对数线性分析时(1986)引入社会学文献,并在一篇发表在《社会学方法》(Sociological Methodology)上的重要文章中扩展至多种应用〔Raftery,1995a;也可见Gelman和Rubin(1995)的评论、Hauser鉴赏性的评论(1995),以及Raftery对两人的回应(Raftery,1995b),还有1999年2月的期刊——《社会学方法和研究》(Sociological Methods and Research),该期内容全部都是对BIC的评价〕。从某种意义上讲,BIC与传统的显著性检验的操作原则相反。它是似然比测量,即告诉我们基于数据,哪个模型最可能是真实的(关于最大似然估计的简要介绍,见附录12.B);相反,经典的推论告诉我们,基于理论模型(零假设),由抽样误差生成观测数据的可能性有多大。
1702646933
1702646934
BIC相比前面介绍的F检验有三个重要优点。第一,跟F比率不同,BIC可用来比较非嵌套模型。任何两个描述同一现象的模型都可以进行比较。第二,如果样本量足够大,事实上任何R2的增量都会是显著的,即使该增量很小且无实质重要性。BIC可以对大样本的影响进行校正。要生成特定的BIC值,对大样本R2增量的要求会比小样本大。因此,BIC反映出传统建议,即当样本大时应选择较小的概率值。第三,BIC使复杂模型处于不利位置。因此,如果要引入很多变量才能产生一定的R2增量,BIC比F检验更可能建议我们选择简单的模型。有几种具体计算BIC值的方法,这取决于所分析的特定统计量。要比较回归模型,我们可以用Raftery的方程26:
1702646935
1702646936
BICk=N[ln(1-R2k)]+pk[ln(N)] (6.35)
1702646937
1702646938
这里,R2k是模型k的R2值,pk是模型k的自变量数量,且N=分析的样本数。BIC为负值表示所设定的模型与自变量和因变量没有关系的基准模型相比更可能是真的。为了比较两个模型,我们对每个模型估计BIC,并选择BIC的负值更大的模型。Raftery(1995a:表6)给出了一个比较BIC的习惯原则:BIC的差异在0~2之间表示两个模型孰优孰劣的证据“很弱”;差异在2~6之间表示有“一定”的证据;差异在6~10之间表示有“强有力的”证据,差异大于10表示有“很强”的证据。然而,因为BIC随样本的增大而变大,Raftery的习惯原则最适用于相对较小的样本。
1702646939
1702646940
要了解如何使用BIC,让我们计算表6-3中三个模型的BIC值。对模型1,我们有:
1702646941
1702646942
BIC1=1481×ln(1-0.053)+1×ln(1481)=-73.4 (6.36)
1702646943
1702646944
对模型2,我们有:
1702646945
1702646946
BIC2=1481×ln(1-0.089)+4×ln(1481)=-108.4 (6.37)
1702646947
1702646948
对模型3,我们有:
1702646949
[
上一页 ]
[ :1.7026469e+09 ]
[
下一页 ]