打字猴:1.702647252e+09
1702647252 量化数据分析:通过社会研究检验想法 [:1702644768]
1702647253 量化数据分析:通过社会研究检验想法 检验系数的等价性
1702647254
1702647255 有时,我们想知道同一方程中的两个系数大小是否相等。你们在前一章看到的对方程6.30的讨论就是一个例子。这里,我们再介绍另外一个例子。假设我们要评估父母的受教育程度对受访者的受教育程度的影响,尤其是对父母哪一方对子女的影响更大感兴趣。有假设认为,经母亲的教育传递比经父亲的教育传递更强,因为据观察,母亲投到孩子身上的时间多于父亲,所以推断母亲扮演更加重要的社会化角色。另一个相反的假设是,父亲的受教育程度影响更大,因为父亲的社会经济特征在很大程度上决定了家庭的社会经济地位。由于教育存在机会成本,所以如果父亲没有受到很好的教育,孩子就更可能较早地离开学校,由家庭的财务负担转变为家庭经济的贡献者。
1702647256
1702647257 有了这两个竞争性的假设,我们再来估计受访者的受教育年限对父亲和母亲受教育年限的回归方程。我用1980年的GSS数据估计下面形式的方程:
1702647258
1702647259
1702647260
1702647261
1702647262 这里,E=受访者的受教育年限,EF=父亲的受教育年限,EM=母亲的受教育年限。(我选择1980年的GSS数据,是因为在数据中父亲和母亲的影响存在显著差异。用2004年的GSS数据得到的两个系数几乎相等。估计父母受教育年限相对影响的历时趋势及其原因将会是一篇很有意思的文章。)估计方程7.27,其中N=985,得到:
1702647263
1702647264
1702647265
1702647266
1702647267 此结果看似支持母亲的受教育程度比父亲的受教育程度对子女教育获得的影响更大这一观点。然而,此结果可能只是抽样变异性导致的。如何进行判断?其方法是让母亲和父亲受教育年限的系数相等,然后评估非约束方程(7.28)的R2是否显著地大于约束方程的R2。我们限定父母受教育年限的系数相等,估计下面形式的方程:
1702647268
1702647269
1702647270
1702647271
1702647272 这里,EP=EF+EM。因此,我们有:
1702647273
1702647274
1702647275
1702647276
1702647277 注意,就检验这里的假设而言,用母亲和父亲的受教育年限之和定义一个新变量与用母亲和父亲受教育年限的均值定义一个新变量是等价的。如果是用均值的话,仅仅是系数大小翻倍而已。在这个例子中,用父母的受教育年限之和更容易解释,因为它保留了对母亲和父亲受教育程度的独立测量的量度。估计方程,我们得到:
1702647278
1702647279
1702647280
1702647281
1702647282 下面我们比较两个模型。首先,我们用F检验看系数是否相等,它与检验R2增量的显著性是等价的。使用Stata的-test-命令很容易实现。其实,我们甚至不必建构约束模型。我们只需在估计了非约束模型之后简单地执行命令-test paeduc=maeduc-即可。这样得到的F值为1.40,它不显著(p=0.236);注意,因为我们进行的是双尾检验(我们的假设是期望父母任何一方的影响大于另外一方),拒绝零假设所需达到的常规显著性水平是0.025。当然,比较模型的另一种方法是比较两个模型的BIC,但这样做就需要估计约束模型。用常规方法估计的两个BIC值为:
1702647283
1702647284 非约束模型:   -355.4
1702647285
1702647286 约束模型:    -360.9
1702647287
1702647288 在此例中,BIC和F检验都支持系数没有差别的约束模型。这里所介绍的一般性分析策略可以被广泛应用于各种实际问题。
1702647289
1702647290
1702647291
1702647292
1702647293 量化数据分析:通过社会研究检验想法 [:1702644769]
1702647294 量化数据分析:通过社会研究检验想法 趋势分析:检验线性假设
1702647295
1702647296 随着GSS的成熟,它已经成为越来越有价值的研究历时趋势的资源。因为自1972年首次开展GSS以来,许多问题都用完全相同的方式询问,将所有年份的数据合并在一起就可以做各种趋势分析。此外,如果没有发现时期变异,所有年份的数据可以作为美国20世纪后期人口的一个样本以得到足够多的个案去研究人口相对较少的群体。
1702647297
1702647298 最简单的趋势模型(暂不考虑有限的没有趋势的情况)是所研究的结果变量随时间变化的线性趋势。将此模型与一个假设结果变量逐年变异的模型——许多年前Sorokin将之称为“无趋势波动”(trendless fluctuations)——进行对比是很有益的。为进行这一比较,我们估计两个模型:
1702647299
1702647300
1702647301
[ 上一页 ]  [ :1.702647252e+09 ]  [ 下一页 ]