打字猴:1.702650502e+09
1702650502
1702650503 表15-2给出了FE模型的估计结果,出于比较的目的,我也给出了我们在前面碰到的OLS模型的估计结果。“ch15_1.do”和“ch15_1.log”是产生这些结果的Stata文件,可从网站下载。
1702650504
1702650505 表15-2 1996年家庭收入(人民币)决定因素的OLS模型和FE模型估计值的比较(N=5342)
1702650506
1702650507
1702650508
1702650509
1702650510 注意,FE模型和OLS模型的估计结果明显不同。有趣的是,受教育年限的效应在FE模型中比在OLS模型中明显要强,在一定程度上与我的预期相反。此前我可能会预期收入的社区差异与受教育年限的社区差异之间的相关会导致OLS分析夸大受教育年限的效应。此外,年龄的效应在FE模型中勉强显著,而在OLS分析中根本没有影响,也许是因为年轻人倾向于迁到高收入领域,从而减小了在FE模型中出现的年龄对收入的正面影响。两种分析都显示,在控制了社会人口特征后,种植农作物的家庭的收入显著高于不种植农作物的家庭,而经营非农业企业的家庭明显挣得较少。虽然它们的符号和显著性水平在OLS和FE分析中没有实质性的差异,但与OLS模型相比,其效应在FE模型中明显减小。总之,很明显,FE产生的结果与OLS分析产生的结果很不同。因为FE方法排除了由同时影响预测变量和结果变量的社区因素引起的偏误,此方法明显比OLS回归要好。
1702650511
1702650512 但是,我们能做得更好些吗?RE模型怎样呢?回想FE模型的一个重要缺陷是:不能研究在分析单元内不在个体之间变化的特征(或个体不随时间变化的特征),因为它们在差分步骤中被剔除了。RE模型不受此缺陷的影响。因此,举个例子,用RE模型我们可以研究诸如社区在城镇分级中的位置等特征。然而,正如前面讨论过的,只有在未观测效应αi独立于其他变量(观测到的随时间变化或在分析单元内的个体之间变化的变量xit,观测到的不随时间变化或在分析单元内的个体之间不变化的变量zi,以及异质性误差εit)时,RE系数才是有效的。可以检验这个假定,其方法是用Hausman检验比较FE和RE模型中相应系数的相似性(用Stata进行检验的具体方法,见可下载文件“ch15_1.do”)。结果是系数相似性的假设被拒绝,这意味着RE模型估计是有偏的,因此我们必须选择FE估计。要记住,并没有拒绝FE和RE系数之间无差异的零假设,可能意味着两组系数非常相似,也可能是标准误太大以至于无法得出这种推论。也就是说,即使通过了Hausman检验,你们也应该避免轻易接受RE估计的合理性。正如前面提到的,针对这类问题,在模型设定方面有较大灵活性的高级方法见Bollen和Brand(2008)。
1702650513
1702650514
1702650515
1702650516
1702650517 量化数据分析:通过社会研究检验想法 [:1702644836]
1702650518 量化数据分析:通过社会研究检验想法 针对二分结果变量的固定效应模型
1702650519
1702650520 针对二分结果变量的FE模型,其逻辑与连续型变量的情况相似,但步骤有点不同。让我们从针对两个时点的二项逻辑斯蒂回归的FE模型开始,写出一个类似于方程15.1的方程:
1702650521
1702650522
1702650523
1702650524
1702650525 这里,pit是yit=1而不为0的概率,其余各项与方程15.1中的定义一样。此外,我们需要假设在个体内,yi1和yi2彼此独立。因此
1702650526
1702650527 Pr(yi1=0,yi2=0)=(1-pi1)(1-pi2)
1702650528
1702650529 Pr(yi1=1,yi2=0)=pi1(1-pi2)      (15.20)
1702650530
1702650531 Pr(yi1=0,yi2=1)=(1-pi1)pi2
1702650532
1702650533 Pr(yi1=1,yi2=1)=pi1pi2
1702650534
1702650535 因为我们的目标是在控制不随时间变化的协变量时估计μt和β,所以我们只用个体内的变化估计这些参数。因此,由于那些结果变量yit在时点1和时点2之间不变化的个体没有提供任何信息,因此我们从样本中删除了他们。结果剩下方程15.20的中间两行。我们对这些概率的比率取对数,得到一个把zi和αi“差分掉”(differences out)的方程:
1702650536
1702650537
1702650538
1702650539
1702650540 代入方程15.19中的右边各项,我们有:
1702650541
1702650542
1702650543
1702650544
1702650545 注意,对于那些在时点1和时点2结果变量取值不同的人,方程15.22中的结果变量与时点2“正”结果的对数比率是等价的。因此,方程15.22可简化为一个传统二项逻辑斯蒂回归方程,其中预测变量是各x的差分值。然而,因为方程15.22只对那些结果发生变化的个体进行估计,通常样本规模相对于整体样本而言有较大缩减,所以在解释FE逻辑斯蒂回归结果时,应记住这个问题。
1702650546
1702650547 可以借助条件最大似然估计将FE估计一般化为允许每个人有两个以上时点(或在一个分析单元中有2个以上的个体)的观测值。也就是说,当每个单元存在两个以上的观测值时,问题变为一项条件逻辑斯蒂回归分析〔所涉及的代数知识在Allison(2005:57-59)中有简要介绍;也可以参见StataCorp(2007)中-clogit-的命令条目以及引用的文献〕。
1702650548
1702650549
1702650550
1702650551
[ 上一页 ]  [ :1.702650502e+09 ]  [ 下一页 ]