1702648106
1702648107
在当前的例子中,尽管我们已经尽力对样本进行分层,但对受教育年限而言我们仍有相对较大的deff:2.99。这就意味着对受教育年限的估计而言,大约6000人的整群样本的精确度相当于2000人的简单随机样本的精确度。虽然相比于从基于1990年中国人口普查数据的设计实验中我们得到的城乡样本设计效应(8.22和13.43)而言,这已经是很大的进步,但设计效应依然偏大。幸运的是,模型中的其他变量并没有如此大的设计效应(除了截距项)。
1702648108
1702648109
在对调查结果进行分析的过程中,事实上并没有什么理由去计算deff。因为deff所提供的信息主要用于设计一项新的调查(如前面讨论的中国人口普查数据)。对于已掌握足够抽样设计信息的样本,我们只需简单地用标准方法进行分析,唯一不同的是,我们应该使用调查估计的命令,而不是假设的简单随机抽样的命令。但不幸的是,我们所需的这类信息经常——事实上是在很多情况下——都没有包含在调查文件中,尤其是对过去的调查而言。
1702648110
1702648111
在这种情况下,有一种次优的方法。比如将样本看作比实际的样本小,例如将其赋予权重为0.75、0.67或0.50(这很容易完成,我们可以创建一个权重变量,并令之等于0.75、0.67或0.50,或设计效应的倒数;或者我们也可将任意存在的权重变量与设计效应的倒数相乘)。用0.75加权也就是假设分析中的每个统计量都具有1.33(=1/0.75)的设计效应。由于不同统计量的设计效应可能显著不同——正如我们已经看到的那样,因而这并不是最优的方法,但至少它优于那些盲目假设多阶段概率样本中的所有调查数据与简单随机样本中的调查数据一样准确的方法,那正是当我们对设计效应不做任何修正时所做的。
1702648112
1702648113
在GSS调查中,设计效应在态度题项上大约为1.5,而在社会人口题项上则大约为1.75,对不同的整群来说具体值的差异会更大(Davis and Smith,1992)。因此,我们可以用设计效应的倒数对样本进行加权以近似地修正标准误,例如,至少我们可以用0.57(=1/1.75)对GSS数据进行加权。然而,最近年份的GSS数据包括了SAMPCODE变量,因而可以使用调查估计方法。GSS使用复杂抽样方法,其抽样方法每十年都会发生变化,而且使用不同的抽样框。因此,从某种程度上讲,在趋势分析中正确使用调查估计方法是一件棘手的事情,即使将年份看作层也仍是如此。然而在分析单个年份的GSS数据时,调查估计则稍微容易(有关GSS样本设计的变化及其对调查估计的影响可参见附录B)。
1702648114
1702648115
调查估计的替代方法 如果仅在一个层存在整群效应,且缺乏分层信息时,我们可以用传统的回归命令-regress-结合-robust-或-cluster-选项来作为调查估计命令的替代。这种方法将给出与未分层情况下(四舍五入条件下)使用调查估计命令一致的标准误。也就是说,-robust-和-cluster-选项考虑了整群效应,但不考虑分层。一般来说,不考虑分层会产生较大的标准误,但并非总是如此。
1702648116
1702648117
这一方法使得即使当样本设计信息缺失时,我们也可以对整群效应进行部分修正。由于几乎所有的大型人口调查都是在地理意义上整群分布的,所以可以用地理位置作为整群变量。此外,在有包含家庭户及其成员信息的数据时,也可将家庭户代码作为整群变量(加上数据中任意的地理位置代码)。
1702648118
1702648119
如何在Stata中对样本规模进行向下加权 当我们了解到或怀疑调查使用了复杂抽样方案,但又缺乏其他信息的时候,为了近似地反映抽样设计效应对标准误的膨胀效应,我们应该用1~3个因子对数据进行向下加权。在Stata中我们可以使用[iweight]命令来创建一个不对样本规模进行标准化的权重,以实现这一目的。应注意,使用[iweight]就相当于使用[aweights],而不同于使用[pweights]。但在做模型估计时使用[aweights]一般不正确,它会比使用[pweights]产生更小的标准误。因此,这显然是一种退而求其次的方法。所以在大多数情况下,我们应努力确定实际的抽样设计,并获得变量以正确修正复杂抽样设计效应的调查估计方法(但我们需要非常努力才能做到这一点)——即使这意味着我们需要重新联系那些可能已经转向其他研究的调查初始负责人,是他们在最初就未注意去整理这类关于抽样设计的文件。
1702648120
1702648121
次级总体分析:教育和种族对女性收入的影响
1702648122
1702648123
关于Stata中基于抽样设计的估计程序,有一点值得特别强调:当分析仅限于一部分样本时,简单地排除那些不满足条件的样本是不合适的。其原因在于抽样设计的特征适用于整个样本,而不适用于分析时所选择的次级样本。要正确地分析次级样本,应在Stata的估计命令中使用-subpop-选项(参见下载文件“ch09.do”和“ch09.log”的第三部分)。为了说明如何使用该选项,以及进一步展示使用调查估计方法将如何显著地改变结论,这里我会使用1994年GSS数据简单地分析教育和种族对女性收入的影响。
1702648124
1702648125
1994年GSS数据是一个分层的多阶段样本。第一阶段的抽样单位是2489个美国城市地区和非城区的县,它们被分成100个层,每层用PPS方法随机抽取一个初级抽样单位(PSU);然后在初级抽样单位内继续用PPS方法抽取384个二段单位(街区),并视具体情况进行第三阶段抽样。但GSS数据文件中仅仅使用变量SAMPCODE来识别PSU。如我们之前解释过的,因为Stata不允许每层只识别一个PSU,因而我设定PSU,但不设定层,将分析看作只包括一个抽样阶段。这种方法很可能低估真实的标准误,但就我们得到的信息而言它是最好的选择。
1702648126
1702648127
表9-5显示了三个模型的系数和标准误,每个模型都用三种方法估计:一是将样本直接看作总体的简单随机样本;二是对样本进行加权以修正不同家庭户规模的影响;三是考虑GSS调查中使用多阶段抽样设计带来的第一阶段的整群效应。在这些模型中,教育以样本中女性平均受教育年限的偏差来表示。
1702648128
1702648129
我们先来比较各个模型。显然,调整由于家庭户规模差异而导致的在抽样时被选中的概率差异对结果具有不可忽略的影响。基于不加权简单随机样本的估计(第I部分)显示,相比于模型1,模型3的R2显著增加,因而我们的结论是不同种族女性收入的决定因素不同。然而加权样本估计(第Ⅱ部分)和调查估计(第Ⅲ部分)都不能得出同样的结论。根据这两种估计,我们应接受女性的教育回报并不存在显著的种族差异的零假设。这也向我们展示了修正将家庭户样本看作个人样本所导致的误差会给结论带来很大的变化。
1702648130
1702648131
表9-5 1994年美国成年女性的收入决定因素模型,多种设计假设(N=1015)
1702648132
1702648133
1702648134
1702648135
1702648136
如果不对数据进行加权,则另外一种替代方法是引入家中成年人数量的一系列虚拟变量,以及这些虚拟变量分别与种族和教育的交互项,或者还需引入这些变量的三维交互项。除非我们分析的重点是种族和教育的差异如何随家中成年人的数量而变化,否则该方法显然过于复杂和冗长。总的来讲,我认为这个例子清楚地说明了当信息允许时,我们一般应该进行调查估计的原因。
1702648137
1702648138
我们还应注意,在第Ⅱ部分和第Ⅲ部分的相应模型中,尽管标准误不同,但R2却是相同的。这遵循R2的定义,即它是围绕回归面的方差与围绕因变量均值的方差之比的函数。由于在第Ⅱ部分和第Ⅲ部分的点估计相同,因而R2也相同,尽管第Ⅲ部分的点估计具有较大的置信区间。
1702648139
1702648140
还应注意我们没有报告BIC估计量。尽管我们可以对简单随机样本计算BIC,就如同我们在第6章和第7章所做的那样,但BIC对加权样本或整群样本却并不适用。对这类设计,我们估计伪似然函数,它们可能和真实似然值有显著的差异,并且在嵌套模型间以非单调的方式变化。因此,无论是似然比检验,还是BIC(计算时要用到似然值)都不能用于加权或整群样本的模型比较。相反,我们可以使用Stata的-test-和-svytest-命令所提供的Wald统计量。(最大似然估计是我们在第12章至第15章最常使用的估计方法,其详细介绍参见附录12.B。)
1702648141
1702648142
合并历年GSS数据
1702648143
1702648144
之前我曾建议,在某些情况下可将从同一总体中抽取的几个样本合并成单一数据集。尤其在假设某一社会过程不随时间发生变化时,可以将不同年份的GSS样本合并以增加样本数量。在第7章分解均值差异的例子中我曾这样做过。现在我对同一数据稍作修改,以研究1990~2004年教育获得的种族差异(非黑人与黑人)。这个例子主要是为了说明如何合并数据(关于Stata程序,参见下载文件“ch09.do”的第四部分)。在这一分析过程中,由于每一年的样本是固定的,因此我可以将年份看作层变量。然后我通过少量的计算创建一个在各年份一致的权重变量(详细过程可参见下载文件)。在加权后,我用常规方法进行调查估计。表9-6是估计的结果。
1702648145
1702648146
表9-6 1990~2004年美国成年人的教育获得模型(N=15932)
1702648147
1702648148
1702648149
1702648150
1702648151
对我们目前的目的来说,deff和meff都是有参考价值的。最大的deff显示,在对出生于南方(即16岁时在南方居住)这一变量系数的估计中,我们的样本具有与8754(=15932/1.82)人的随机样本同样的功效。当然,由于我们的样本已经足够大(它是8个GSS样本的合并),所以这个等效的随机样本也非常大。Meff系数也很大,尤其是对母亲的受教育年限而言。这再次说明不考虑加权或整群效应的简单分析会是误导性的,尽管我们有足够大的样本来弥补这一点。尽管结果非常有趣,但我不再对它们做进一步评论,因为在很大程度上这与第7章的讨论重复了。
1702648152
1702648153
1702648154
1702648155
[
上一页 ]
[ :1.702648106e+09 ]
[
下一页 ]