1702647320
·如果您的党派提名一名妇女做主席,且她胜任此工作,您会投票给她吗?(84%的受访者持肯定态度)
1702647321
1702647322
·请告诉我您是否同意这种观点:从性情上来说男性比女性大多更适合从政?(63%的受访者反对)
1702647323
1702647324
我简单地将对四个问题持赞同性别平等的应答加总,构建一个性别平等测度,排除了那些没有被问到这四个问题的人,并将其他无应答情况作为负值对待,将“不知道”之类的应答作为负值而不删除它们是为了保留样本。但是,如果没有实质性的理由,这样处理不一定是明智之举——在当前的例子中,我似乎有理由将“不知道”与赞同性别平等看作两个不同的类别。
1702647325
1702647326
在实施GSS的某些年份,只有部分受访者才会被问及某些问题 GSS使用者需要知道,为了每年都能在GSS的调查问卷中增加问题的数目,仅有部分受访者才会被问及某些问题。排除没有被问及某些问题的那些人的一个常用方法是在Stata软件的-egen-命令中用-rmiss-选项来计算缺失值的数量,然后排除测度指标中在所有题项上都有缺失值的人。但是,在现在分析的这个例子中,只要受访者在四个题项中的任何一个上存在缺失值,我就将之排除在外,因为有些年份只问了这四个题项中的某几项。
1702647327
1702647328
方程7.32和7.33的估计结果表明,关于性别平等的态度呈显著的非线性。根据R2增量得出F=3.54,它在14和21448自由度下具有小于0.0001的概率。但是,线性趋势模型的BIC比逐年变异模型的BIC小(BIC值分别为-959和-871),这意味着数据更有可能存在线性趋势。因为使用BIC得出的结果和使用传统推论方法得出的结果相矛盾,明智的做法是接下来图示赞同性别平等的均值水平的逐年变异,以观察是否存在任何明显的非线性模式。如果观察到十分显著的线性偏差,就可以接受逐年变异模型,或者通过将一些年份聚合成有历史意义的时期来建立一个新模型(要谨记根据数据结果来修正假设的危害性——见第6章结尾处对此问题的讨论),抑或用平滑曲线或样条函数来拟合数据。图7-4显示了线性趋势直线和均值水平的逐年变异连接线。检视该图我们会发现,线性偏差既不明显也不是系统性的。因此,我倾向于把线性趋势模型作为表述数据的最简形式,而不管F检验的结果如何。事实上,线性趋势是相当强的,它意味着在我们数据所跨越的四分之一世纪里,赞同性别平等的均值水平提高了0.81[=0.0338×(1998-1974)];这相当于我所构建的性别平等测度的理论区间得分(0~4)的20%,且相当于该测度实际得分标准差的三分之二。显然,对性别平等的支持水平在整个20世纪后期一直在稳步上升,且有一定程度的提高。
1702647329
1702647330
1702647331
1702647332
1702647333
图7-4 美国成年人在1974~1998年调查中表现出的对性别平等的态度趋势(线性趋势和年度均值水平;N=21464)
1702647334
1702647335
从技术的角度看,比较两种反映线性偏差的估计值——方程7.33和另一种没有包含年份线性项的方程设定——是有意义的。当包括线性项时,两个虚拟变量被省略(而不是一个),因为线性项占用一个自由度。然而,用这两种方法得到的结果完全相同,这在表7-1中得到了印证。
1702647336
1702647337
遗憾的是,方程7.33(或类似形式的方程)的系数与线性方程预测值的偏差之间没有简单的对应关系。如果你们想展示逐年的线性偏差,那么需要构建一个新变量,即方程7.32和方程7.33每年的预测值之差。在Stata中使用-foreach-或-forvalues-命令很容易实现这一点。
1702647338
1702647339
表7-1 包含线性项但不会影响预测值的示范
1702647340
1702647341
1702647342
1702647343
1702647344
1702647345
1702647346
1702647348
量化数据分析:通过社会研究检验想法 线性样条
1702647349
1702647350
有时会遇到这样的情况:我们相信两个变量之间的关系在自变量分布的某一点上会突然发生变化,因此,用线性或曲线来表示此关系都不合适。例如,在低于某特定值时饮酒量可能对健康没有影响,但超过此门槛值后,健康状况会随着饮酒量的增加而线性下降。政策变化或经济萧条、战争、革命等灾难性事件也会使历时趋势发生突然变化。在这种情况下,用一组相连的线段表示这类关系是很有用的,这就是线性样条(linear splines)。
1702647351
1702647352
一个具体例子:美国教育获得的历时趋势
1702647353
1702647354
设想平均受教育水平随时间变化。图7-5是依据GSS估计的受教育年限与出生年份的散点图。为了构建此图,我将1972~2004年所有年份的数据合并在一起。但是,我删除了1900年以前出生的人,因为此样本太小会导致不稳定的结果。我也删除了在调查时年龄不到25岁的人,因为许多人直到大约25岁时才完成学业。为了使图示清晰,我只使用了5%的样本,并且使用了“jittered”选项以清楚地显示图中数据点分布的疏密程度。审视此图你们会发现,美国人的平均受教育水平长期以来一直在提高,但其提高模式很难辨别——趋势到底是线性的还是用其他函数形式来表达更好?
1702647355
1702647356
1702647357
1702647358
1702647359
图7-5 美国成年人按出生年份划分的完成的受教育年限(GSS 1972~2004年的合并样本,N=39324;散点图显示的是5%的样本)
1702647360
1702647361
要弄清楚平均受教育水平如何随时间而提高,我们可以对每个出生队列完成的受教育年限的平均值作图,结果见图7-6(数据设定与散点图相同)。审视该图,你们可以看到,对出生于1900~1947年的人来说,平均受教育水平差不多是以线性方式提高的;但对之后的出生队列来说,平均受教育水平则保持稳定。因为图形有点波动——这可能是每个出生队列的样本量相对较小所致——对平均受教育年限取三年移动平均值(moving average)作图可能会更好。结果见图7-7(关于如何创建这些图,在可供下载的-do-和-log-文件里有详细说明)。审视此图,我们可以得到同样的结论——在趋势上该图有一个较突然的变化,那些在20世纪上半叶(确切地讲是1947年前)出生的人,其受教育年限相当稳定地逐年增加,但那些1947年或以后出生的人在受教育年限上基本没有变化。这意味着教育获得的趋势可以恰当地用一个节点位于1947年的线性样条来表示,这里的“节点”是指斜率发生变化的转折点。
1702647362
1702647363
1702647364
1702647365
1702647366
图7-6 美国成年人按出生年份划分的平均受教育年限(与图7-5使用的数据一样)
1702647367
1702647368
1702647369
[
上一页 ]
[ :1.70264732e+09 ]
[
下一页 ]