打字猴:1.70264546e+09
1702645460
1702645461
1702645462
1702645463
1702645464 如表2-12所示,尽管宗教信仰群体分别与年龄和受教育程度有关,且对人类起源的进化学说的接受程度也分别与年龄和受教育程度有关,但是对年龄和受教育程度进行标准化处理后,不同宗教信仰群体对接受“人类是从其他动物进化来的”观点的组间差异几乎没有变化。其中的一个特例是不信教群体,他们更支持进化论观点的部分原因是他们相对年轻。尽管上面的分析并没有大大改变我们最初观察到的新教原教旨主义者、犹太教徒和其他宗教信仰群体之间的差异,但我们的一个主要发现是,不同宗教信仰群体对进化论观点接受程度的差异不应简单地归结为这些群体在年龄和受教育程度方面的差异,相反,这些差异可能来自这些宗教派别在教义上的差异。
1702645465
1702645466 实例3:南非职业地位的种族差异
1702645467
1702645468 现在让我们来考虑另一个例子:南非职业地位的种族差异在多大程度上可以被教育方面的种族差异所解释〔数据来自1990年代早期完成的南非经济机会和成就调查(Survey of Economic Opportunity and Achievement in South Africa)(Treiman,Lewin,and Lu,2006);这个例子的Stata-do-和-log-文件可以通过下载获得;关于数据集及如何获取的信息参见附录A〕。从表2-13的左边一栏很容易看出,不同种族在职业获得方面存在很大差别。与白人相比,非白人,尤其是黑人,在很大程度上更不可能成为管理人员、专业人员或技术工人,而在更大程度上可能成为半技术或非技术体力劳动者。而且,相对于其他种族而言,黑人更有可能失业。众所周知,在南非,人们的受教育程度存在明显的种族差异,白人的受教育程度最高,其次是亚裔(在南非,亚裔主要是来自印度次大陆的合同工人的后代)、有色人种(混合种族)和黑人(这些是南非传统上的种族分类)。同其他地方一样,在南非,职业获得在很大程度上依赖于教育获得(Treiman,McKeever,and Fodor,1996)。据此,我们预期职业获得方面的种族差异可以在很大程度上被教育获得方面的种族差异所解释。实际上,该结果来自Treiman,McKeever and Fodor(1996)的研究,他们用国际社会经济地位指标(International Socioeconomic Status Index,ISEI)(Ganzeboom,de Graaf,and Treiman,1992;Ganzeboom and Treiman,1996)作为职业地位的衡量标准。然而,也会存在另一种可能,比如对专业人员和技术人员这种职位,受教育程度可能起到主要的作用,但是对另一些职业,如管理职业,即使人们的受教育程度满足要求,该职业的获得仍然取决于其种族身份。
1702645469
1702645470 表2-13 1990年代早期南非20~69岁男性分种族的各职业的百分比分布(显示各种族教育获得标准化前后的百分比a;N=4004)
1702645471
1702645472
1702645473
1702645474
1702645475 为了确定哪些职业类别在种族上的差异能够被教育方面的种族差异所解释,我依照受教育程度调整了(直接标准化了)种族和职业地位之间的关系。这里,我用以加权数据计算的白人的教育分布作为标准分布,然后计算如果其他非白人群体的受教育程度和白人一样的话,他们的职业分布会是怎样的。
1702645476
1702645477 结果如表2-13的B栏所示。该结果非常具有启发意义。当其他种族具有与白人一样的教育分布(假设这样做不影响每个群体内受教育程度和职业获得的关系)时,成为专业人员的可能性在种族间的差异完全消失了。实际上,黑人比其他种族稍稍更有可能成为专业人员。相比较而言,每个种族的管理类职位的比例基本保持不变,这意味着不是受教育程度而是允许谁管理谁的规则解释了此类职业的种族差异。其他较大的变化仅发生在1~2个非白人群体中:亚裔除了在半技术工人的比例上有所下降外,在其他职业上没有显著的变化;有色人种的技术人员的比例升高了,而半技术和非技术工人以及农民的比例下降了;黑人在办事员这一职业上的比例升高了,而在所有体力工作上的比例下降了。如果所有四个种族都具有与白人一样的教育分布,白人与亚裔的职业分布相异指数(用Δ测量,见第3章)降低约30%(从29.2降至20.5),白人和有色人种的职业分布相异指数也降低了相似的程度(从37.9降至26.5),然而白人和黑人的职业分布相异指数仅降低了约12%(从52.4到46.1)。在控制受教育程度的影响后,四个种族在职业分布上的显著相异指数表明,Treiman、McKeever和Fodor的结论——在南非,受教育程度在很大程度上解释了种族之间在职业地位上的差异——并没有说明事情的全貌。
1702645478
1702645479 实例4:中国城乡文化水平的差异
1702645480
1702645481 现在介绍最后一个实例——在中国,教育、居住地和文化水平之间的关系。在1996年全国成年人口的抽样调查中(Treiman,Walder,and Li,1996),受访者被要求区分10个中文词(关于此数据的介绍和来源,见附录A)。正确识别这些词的数量被用来衡量文化水平(Treiman,2007a)。显然,识字水平会随受教育程度的提高而升高。城镇人口的识字能力较强,这是因为城镇受访者可能比农村受访者受过更多的教育。我们感兴趣的问题是,农村人口和城镇人口在受教育程度上的差异是否能完全解释识字水平的平均差异(1.8个词)(见表2-14)。为了回答这个问题,我用加权数据计算了全国成年人口的教育分布,并假设城镇人口和农村人口具有同样的教育分布,然后计算出调整后(即直接标准化)的城镇人口和农村人口的平均识字水平。这里需要注意的是,在此例中,标准化的不是百分比而是均值。这两种指标的计算步骤是完全一样的。但由于是用计算机(Stata)完成的,所以我们需要对数据做特殊调整以克服Stata软件的局限——Stata要求进行标准化(Stata称为-charvar-)时“比率”的分子是整数。具体操作步骤请查阅本章与此例有关的-do-和-log-文件。
1702645482
1702645483 表2-14 中国1996年20~69岁城镇和农村人口的平均识字水平(显示的是用城乡教育分布差别进行直接标准化前后的均值a;N=6081)
1702645484
1702645485
1702645486
1702645487
1702645488 结果非常简单明确。当用教育进行标准化后,城乡人口正确识别中文词平均值之间的差异由1.8个词减小到0.6个词。因此,城乡人口受教育程度的差异可以解释城乡人口在识字水平上差异的67%(=1-0.6/1.8)左右。
1702645489
1702645490 虽然这四个实例都是对受教育程度进行标准化,但这仅仅是凑巧而已。直接标准化也可以应用到许多其他方面。例如,也许通过对年龄和性别进行标准化就能解释20世纪早期在美国移民的犯罪率比当地居民高的现象。移民大多是年轻男性,一般认为年轻男性的犯罪率比其他性别年龄的人群高。
1702645491
1702645492
1702645493
1702645494
1702645495 量化数据分析:通过社会研究检验想法 [:1702644729]
1702645496 量化数据分析:通过社会研究检验想法 关于统计控制与实验的最后说明
1702645497
1702645498 在介绍列联表的逻辑时,我一直以非实验数据为例介绍其分析的逻辑。这是因为真正的实验在社会研究中很少见,尽管它们被广泛应用到心理学研究中,且在微观经济学中的应用也日益增加〔具体实例参见后面章节,见Thomas等(2004)〕。一个真正的实验是指实验对象被随机分配成两组或更多组,其中的一组接受干预,而另一组不接受干预(受控制),或者几组分别接受不同的干预。如果各组在结果变量上表现出差异,那么就可以认为差异是由不同的干预引起的。在这种情况下,我们能明确地证实干预导致结果不同(尽管我们也许并不清楚内在的机制)。〔当然,这个论点只有当实验组和控制组之间的差异不是由调查者的设计缺陷或没有严格遵循随机实验设计而导致的时候才成立。关于此类问题的经典讨论,参见Campbell和Stanley(1966),或Campbell(1957)的简短讨论,其中包含了Campbell和Stanley文章的核心内容。〕
1702645499
1702645500 对化学等领域的实验,抽样通常不是要考虑的问题,因为我们完全可以假设任何一批化学品与其他批次化学品具有共同的特征;只有当什么地方出现问题了,化学家们才会质疑这个假设。相比之下,在社会学、行为科学及许多生命科学领域,我们不能假设一个研究对象和另一个完全相同。因此,在这些领域的实验中,研究对象需要被随机分配到各个实验组。只有基于这种方法,我们才可能估计结果变量的组间差异是否大于由抽样差异偶然导致的差异。如果两者差异不大,那么我们可以说,由干预导致的差异仅仅是因为统计推断的不确定性。
1702645501
1702645502 在社会科学领域,把研究对象随机分配到各个实验组经常是不可能的。原因有以下几点。首先,由于在人群中实施这类实验,一些伦理和现实的因素都会限制实验的进行。例如,为了研究某类学校的教学是否优于其他学校,如果我们随机将孩子们分配到不同的学校,并在几年后测量他们的受教育水平,这种做法无论从伦理上还是从实际上讲都是不可能的。此外,社会科学家感兴趣的许多现象都无法通过实验来研究,甚至从原理上讲也不可行。例如,在战争时期群体内部的团结倾向于增强,这个论点是无法通过实验验证的;同样,社会分层在靠定居农耕为生的社会中比在靠狩猎和采集为生的社会中要更明显,这样的命题就更无法用实验来证实了。
1702645503
1702645504 有时候,“自然实验”(natural experiments)是可以用来进行分析的。自然实验是指不同的个体经历不同的环境,并假设个体在本质上是被随机分配到各个环境里的,这样的假设在这种情况下是合理的。自然实验的一个经典例子是Almond(2006)对“胎源性学说”的实验。他提供可靠证据证实1918年发生严重流感那几个月在母亲腹中的胎儿与之前几个月或之后几个月在母亲腹中的胎儿相比,出生后不仅教育获得要低,而且残疾率高,到中年时的收入也更低。因为孕妇什么月份怀孕与感染流感病毒的可能性之间不太可能相关,在这个分析中自然实验的条件就完全得到满足。由于纠正“样本选择性偏误”的统计方法仍然存在各种缺陷,自然实验在经济学领域变得越来越流行。在最后一章我们将继续探讨这个问题。〔其他一些值得关注的关于自然实验的例子可参见Campbell和Ross(1968)、Berelson(1979)、Sloan等(1988),以及第16章中引用的文章。〕
1702645505
1702645506 考虑到社会科学中可能的实验是有限的,我们在这里和随后将讨论各种统计控制方法。这些方法有一个共同的逻辑:它们都是为了控制一个或一些变量而设计的,以便估计某一给定变量对某一给定结果变量的净影响。
1702645507
1702645508 匹配方法的缺点和一个有用的补救方法 有时,调查分析人员试图通过变量匹配比较组来模拟随机分配。在最初的时候,这种做法本身并不令人满意。当试图匹配所有潜在的相关因素时,样本很容易就用完了,即样本数不够。而且,无论用多少变量进行“倾向分”(propensity score)匹配,实验组和控制组总是有可能在某些没有匹配且与实验结果有关的因素上存在不同。然而,将匹配和统计控制方法结合在一起可能是一个有用的策略,尤其是用“倾向分”来衡量匹配程度时(Rosenbaum and Rubin,1983)。近年来,关于倾向分匹配的文章可参见Smith(1997)、Becker和Ichino(2002)、Abadie等(2004)、Brand(2006)、Brand和Halaby(2006),以及Becker和Caliendo(2007)。Harding(2002)的文章是一篇有启发性的应用文章。倾向分匹配方法将会在第16章介绍。
1702645509
[ 上一页 ]  [ :1.70264546e+09 ]  [ 下一页 ]