打字猴:1.70264695e+09
1702646950 BIC3=1481×ln(1-0.097)+7×ln(1481)=-100.3      (6.38)
1702646951
1702646952 从三个模型的BIC比较中,我们得出结论,数据与模型2最一致,它假设受教育年限对接受堕胎的影响在所有宗教信仰群体中都是一样的,且不同宗教信仰群体在接受堕胎上保持固定的差异(即在每个受教育水平上差异不变)。由BIC差异的大小,我们得出结论,数据“很强有力”地支持模型2而非模型1,“强有力”地支持模型2而非模型3。
1702646953
1702646954 注意,这些结果与我们在前面用F检验通过比较R2获得的结果不一致。对此我们应如何理解呢?这没有明确的答案。我的建议是,首先,跟着理论走。如果你们有理论上的理由认为某一模型比另一个模型合适,那么就选择它。这个建议与Weakliem(1999)对BIC的批评之一相一致——BIC假设“单元优先”。BIC是贝叶斯因子的一个近似值,包含模型之间的一种后似然比较,此处,“后似然是数据似然和研究者的先验值的简单乘积。之后研究者选择似然最大的模型,即基于研究者的先验值和数据,选择具有最大概率为真模型的模型”(Winship,1999a:356)。如果没有明确的理由认为结果会不同于零假设,“单元优先”是合理的——它意味着我们没有关于可能的结果的信息。但是,如果我们有很强的理论上的理由认为存在某种关系,BIC可能就过于保守。在这种情况下,经典的推论似乎是较好的工具,除非我们用别的方法修正BIC——这已经超出本书的范围。我们将在第12章和第13章讨论似然问题。
1702646955
1702646956 缺乏强有力的理论,选择简约的模型,这是BIC通常的做法。在当前的例子中,我倾向于选择模型3,因为我想有理由认为不管受教育水平如何,天主教徒和犹太教徒对堕胎的反应都不会变(天主教徒反对堕胎是因为堕胎被教会禁止,而犹太教徒接受堕胎是因为犹太人社区具有更高的通识教育水平,并且缺乏良好教育的犹太人更可能是移民,他们本身就具有受教育程度较高者的价值观),以及如果新教徒和其他宗教信仰群体受过良好的教育,则他们更容易接受堕胎(因为教育让人能理解更多的事情)。但是,如果我对宗教信仰差异没有很强且条理清晰的解释,我就会选择模型2。
1702646957
1702646958 当然,我们也可以针对由数据推导出的约束模型计算BIC:
1702646959
1702646960 BIC3′=1481×ln(1-0.096)+4×ln(1481)=-121.0
1702646961
1702646962 与模型1、模型2、模型3中的任何一个相比,BIC的负值都很大,因此“很强”地建议我们,对这些数据来说,约束模型更好。
1702646963
1702646964 估计BIC的其他方法 即使有一个给定的统计量,也还有其他版本的BIC。我喜欢Raftery的公式,因为它们内在地与基准模型相比较。因此,我编写了一个小的-do-文件-bicreg.do-,按Raftery的原则计算BIC:
1702646965
1702646966 *BICREG.DO(Updated for Stata 7.0 11/11/01.)
1702646967
1702646968 version 7.0
1702646969
1702646970 *Compute BIC from saved results from regression.
1702646971
1702646972 gen bic=e(N)* ln(1-e(r2))+e(df_m)*ln(e(N))
1702646973
1702646974 *Note:BIC is the same for all observations.Thus,I can
1702646975
1702646976 *list BIC for any observation.
1702646977
1702646978 list bic in 1
1702646979
1702646980 drop bic
1702646981
1702646982 在执行回归命令之后马上执行-bicreg-文件。但是,现在Stata 10.0作为事后估计统计量来提供BIC。如不用我的-do-文件而让Stata计算BIC,可以在回归命令之后立刻执行命令-estat ic-。得到的BIC值会与我的不同,但不同模型之间的BIC的差异是一致的——不管是用哪个版本计算的BIC。
1702646983
1702646984
1702646985
1702646986
1702646987 量化数据分析:通过社会研究检验想法 [:1702644763]
1702646988 量化数据分析:通过社会研究检验想法 独立检验
1702646989
1702646990 注意,我说过“对这些数据”而言约束模型是较好的。这是因为我们是通过审查数据而不是从事先的理论假设那儿得到一个新模型。因此,这样做我们会很容易犯错误,即受到抽样误差的影响。要确切地做出选择此约束模型的结论,我们需要证明它对另一个独立数据集来说也是较好的模型。如果样本大小允许,我们可以用一半数据来进行所有探索性分析,然后用其余一半数据再来估计最终模型(和它的竞争模型)。GSS对此想法提供了一个非常好的模拟,因为它在连续几次调查中重复使用相同的问题,并实施同样的抽样步骤。因此,将邻近年份的调查看作来自同一总体的独立样本是合理的,至少对不会在短期内波动的现象来说是可以的。这样做的意义是:我们能够对一年的数据进行所有的探索性分析,然后用前面或后面年份的数据证实我们结论的有效性。
1702646991
1702646992 我们在这里可以用这种方法使用GSS数据,用1973年的GSS数据重新估计赞成堕胎合法的态度的四个模型。如果我们假设赞成堕胎合法的态度在1973年和1974年人口总体之间不发生变化,用1973年的GSS数据重新估计模型,则构成一个更好地对“约束”模型的独立性检验。表6-4显示的是基于1973年数据的所有四个模型的BIC和R2值,以及模型之间的比较值——只要这些是比较有意义以及合适的。事实上,结果与基于1974年数据所得的结果是一样的:按照经典的统计推论准则,模型3比模型1和模型2好;然而,按照BIC准则,模型2比模型3好;按照BIC准则,约束模型是最好的。因此,我们可以得出结论,通过审查数据我们选择的约束模型是有效的。
1702646993
1702646994 表6-4 1973年美国成年人的宗教信仰、受教育年限和接受堕胎之间关系的不同模型的拟合优度统计量(N=1499)
1702646995
1702646996
1702646997
1702646998
1702646999 续表
[ 上一页 ]  [ :1.70264695e+09 ]  [ 下一页 ]