1702646940
要了解如何使用BIC,让我们计算表6-3中三个模型的BIC值。对模型1,我们有:
1702646941
1702646942
BIC1=1481×ln(1-0.053)+1×ln(1481)=-73.4 (6.36)
1702646943
1702646944
对模型2,我们有:
1702646945
1702646946
BIC2=1481×ln(1-0.089)+4×ln(1481)=-108.4 (6.37)
1702646947
1702646948
对模型3,我们有:
1702646949
1702646950
BIC3=1481×ln(1-0.097)+7×ln(1481)=-100.3 (6.38)
1702646951
1702646952
从三个模型的BIC比较中,我们得出结论,数据与模型2最一致,它假设受教育年限对接受堕胎的影响在所有宗教信仰群体中都是一样的,且不同宗教信仰群体在接受堕胎上保持固定的差异(即在每个受教育水平上差异不变)。由BIC差异的大小,我们得出结论,数据“很强有力”地支持模型2而非模型1,“强有力”地支持模型2而非模型3。
1702646953
1702646954
注意,这些结果与我们在前面用F检验通过比较R2获得的结果不一致。对此我们应如何理解呢?这没有明确的答案。我的建议是,首先,跟着理论走。如果你们有理论上的理由认为某一模型比另一个模型合适,那么就选择它。这个建议与Weakliem(1999)对BIC的批评之一相一致——BIC假设“单元优先”。BIC是贝叶斯因子的一个近似值,包含模型之间的一种后似然比较,此处,“后似然是数据似然和研究者的先验值的简单乘积。之后研究者选择似然最大的模型,即基于研究者的先验值和数据,选择具有最大概率为真模型的模型”(Winship,1999a:356)。如果没有明确的理由认为结果会不同于零假设,“单元优先”是合理的——它意味着我们没有关于可能的结果的信息。但是,如果我们有很强的理论上的理由认为存在某种关系,BIC可能就过于保守。在这种情况下,经典的推论似乎是较好的工具,除非我们用别的方法修正BIC——这已经超出本书的范围。我们将在第12章和第13章讨论似然问题。
1702646955
1702646956
缺乏强有力的理论,选择简约的模型,这是BIC通常的做法。在当前的例子中,我倾向于选择模型3,因为我想有理由认为不管受教育水平如何,天主教徒和犹太教徒对堕胎的反应都不会变(天主教徒反对堕胎是因为堕胎被教会禁止,而犹太教徒接受堕胎是因为犹太人社区具有更高的通识教育水平,并且缺乏良好教育的犹太人更可能是移民,他们本身就具有受教育程度较高者的价值观),以及如果新教徒和其他宗教信仰群体受过良好的教育,则他们更容易接受堕胎(因为教育让人能理解更多的事情)。但是,如果我对宗教信仰差异没有很强且条理清晰的解释,我就会选择模型2。
1702646957
1702646958
当然,我们也可以针对由数据推导出的约束模型计算BIC:
1702646959
1702646960
BIC3′=1481×ln(1-0.096)+4×ln(1481)=-121.0
1702646961
1702646962
与模型1、模型2、模型3中的任何一个相比,BIC的负值都很大,因此“很强”地建议我们,对这些数据来说,约束模型更好。
1702646963
1702646964
估计BIC的其他方法 即使有一个给定的统计量,也还有其他版本的BIC。我喜欢Raftery的公式,因为它们内在地与基准模型相比较。因此,我编写了一个小的-do-文件-bicreg.do-,按Raftery的原则计算BIC:
1702646965
1702646966
*BICREG.DO(Updated for Stata 7.0 11/11/01.)
1702646967
1702646968
version 7.0
1702646969
1702646970
*Compute BIC from saved results from regression.
1702646971
1702646972
gen bic=e(N)* ln(1-e(r2))+e(df_m)*ln(e(N))
1702646973
1702646974
*Note:BIC is the same for all observations.Thus,I can
1702646975
1702646976
*list BIC for any observation.
1702646977
1702646978
list bic in 1
1702646979
1702646980
drop bic
1702646981
1702646982
在执行回归命令之后马上执行-bicreg-文件。但是,现在Stata 10.0作为事后估计统计量来提供BIC。如不用我的-do-文件而让Stata计算BIC,可以在回归命令之后立刻执行命令-estat ic-。得到的BIC值会与我的不同,但不同模型之间的BIC的差异是一致的——不管是用哪个版本计算的BIC。
1702646983
1702646984
1702646985
1702646986
1702646988
量化数据分析:通过社会研究检验想法 独立检验
1702646989
[
上一页 ]
[ :1.70264694e+09 ]
[
下一页 ]