1702650666
相比之下,考虑由Almond(2006)进行的对“胎儿的初始状态”假设(Barker,1998)的检验。假设认为妇女在怀孕时经历的有害事件对出生的孩子有长期影响。用1960年、1970年和1980年人口普查测量的教育获得、职业地位、收入、残疾,以及其他结果,Almond分析了1918年流感大流行的后果来验证这个推断。他发现存在很强的效应,其中一个如图16-1所示。图16-1给出了按1918~1920年间出生季度分布的1980年时男性的残疾率。因为只有在流感大流行时在子宫内的人的残疾率明显更高,而在此之后出生的人的残疾率又回到原来的趋势线,我们可以排除未被测量的、与流感开始流行一同发生的其他变化。更确切地说,任何其他解释都得给出完全与流感一致的时间模式,在此案件中这是极不可能的。
1702650667
1702650668
1702650669
1702650670
1702650671
图16-1 1980年男性分出生季度的残疾情况(因肢体伤残而不能工作)
1702650672
1702650673
资料来源:Almond(2006),图2。
1702650674
1702650675
自然实验 这类分析是非常令人信服的,因为它们构成了自然实验(natural experiments)。正如我们已经看到的,绝大多数非实验研究的难点是我们可能忽略了那些同时影响结果和预测变量的变量,因而使估计值产生偏误。自然实验通过关注在总体中可被认为是随机分布的自然事件而减小或排除了忽略变量偏误(omitted variable bias)。因为在1918年10月流感大流行没有任何征兆,到1919年初基本结束,我们因此有理由将那些在流感大流行月份内仍在子宫内的人看作实验组,而将那些在流感大流行之前和之后在子宫内的人看作控制组。除了那些在流感大流行期间正好在子宫内的人运气不好外,在这些组间没有差异,我们可以合理地推断其结果的差异是由于受到流感大流行的影响。当然,不是所有的怀孕母亲都感染了流感。但是,我们知道大约三分之一的育龄妇女确实被感染了,如果流感确实有影响,此比例对揭示受到影响的结果差异而言已经足够大。Almond的文章也探索了流感大流行的严重性在州与州之间的差异(state-to-state variation),他的文章是如何做这类分析的典型。
1702650676
1702650677
对于自然实验的其他例子,其中一些在如何彻底地克服潜在忽略变量偏误方面比另一些更具说服力,见Deng和Treiman(1997),Ansolabehere、Snyder和Stewart(2000),Abadie和Gardeazabal(2003),Lassen(2005),Oster(2005),Treiman(2007a;也可见第7章对此例子的讨论),以及Lu和Treiman(2008)。
1702650678
1702650679
多层分析 当你们有许多比较组(许多时点、许多国家等)时,从将每组看作一个离散点(通过在模型中纳入一组代表各组的虚拟变量)转向从不同维度(如用经济发展水平、城市化程度等来描述各国的特征)给每组赋值是很有意义的。其中最好的方法是在两个或更多层上进行分析。在后面这种方法中,我们定义了宏观社会“环境”(例如,在教育研究中的班级或学校,或两者;在跨国研究中的社会;在跨时期比较中的出生队列或历史时期;等等)。然后,对每种环境分别估计一个微观方程(代表某些社会过程),而且代表微观过程的系数变异根据环境特征来预测。
1702650680
1702650681
举例来说,假设你希望检验兄弟姐妹数对教育获得的负效应在学费占家庭总收入比例较高的家庭中是较强的。下面是针对这一分析的典型设置:
1702650682
1702650683
Yij=aj+bjXij+εij (16.5)
1702650684
1702650685
其中
1702650686
1702650687
aj=η00+η01Gj+α0j
1702650688
1702650689
bj=η10+η11Gj+α1j (16.6)
1702650690
1702650691
这里,j=1,2,…,J代表环境,或层-2的分析单元(此例指学校系统),且I=1,2,…,nj代表环境内的个体(层-1的分析单元)。层-2方程明确表明,层-1的截距项和斜率都是G的线性函数,即随环境不同而变化〔或者,在这个例子中,当学费较高时,兄弟姐妹数对应的(负)斜率(在绝对值上)比较大;在此例中,我对层-1方程的截距项没有提出任何假设,但我们可以设想当学费很高时教育获得水平较低〕。当然,层-1方程可以包括一个以上的X变量,而层-2方程可以包括一个以上的G变量。
1702650692
1702650693
为了体会多层分析的优势,我们以Lee和Bryk在1989年发表的一篇文章为例,他们分析了高中学校在课程组织上的差异对标准数学测验成绩分布的影响。这篇文章是多层分析标准教材(Raudenbush and Bryk,2002)的作者之一写的,不仅提供了令人信服的实际例子,而且以非常清楚的方式讲述了一些技术问题。使用来自高中及以上(High School and Beyond)学校研究项目的数据(160所高中的10187名学生),Lee和Bryk证明,与有多种课程和多种选择的“大型购物中心”式的学校相比,在对所有学生有标准课程要求的学校中,学习成绩趋向最高,不同种族和社会经济地位的学生差别最小。他们引用这种课程组织上的差异作为天主教学校趋向更加成功的主要原因,尽管这一现象众所周知,但我们以前没有很好地理解。
1702650694
1702650695
我们有多种方法来进行多层分析,包括在第10章讨论的例子中Treiman和Yip(1989)用来讲解回归诊断方法的元分析方法(meta-analysis)。技术细节已经超出了本书的范围。DiPrete和Forristal(1994)的一篇文章对此做了很好的介绍,他们强调实际应用,并介绍了这些技术可以用来做什么研究。Mason(2001)的一篇文章对各类多层分析方法给予了关注,这些方法用来处理因聚集在较高层分析单元(如家庭中的孩子、教室内的学生)内而不独立的观察值。也有几本教材主要介绍多层分析,其中Raudenbush和Bryk(2002)的教材是标准教材,但对技术要求较高,Goldstein(2003)的教材也类似;Snijders和Bosker(1999)的书则相对容易。其他的实际应用例子,见Entwisle和Mason(1985)关于社会经济发展水平与生育率之间关系的研究,DiPrete和Grusky(1990a;1990b)及Grusky和DiPrete(1990)关于美国社会经济地位获得的时期变化研究,以及Sampson、Raudenbush和Earls(1997)关于社区功能在减少犯罪方面作用的研究。
1702650696
1702650697
内生性、样本选择偏误及其他影响正确因果推论的因素
1702650698
1702650699
在这一节,我讨论几种密切相关的情况,它们要求通过特殊处理来避免有偏估计。我也简要介绍一些前几章没有提到的标准解决方法。
1702650700
1702650701
干预效应(treatment effects) 内生性(endogeneity)是指一个或多个预测变量与影响结果的未观测变量相关的情形。因为未观测变量的效应被归因于误差项,所以与这些未观测变量相关的预测变量的系数是有偏的。一种常见的情形是,我们想评估某一干预效应,但这个效应本身就依赖于未被观测到的因素,且这些因素又影响了结果,这就会产生内生性问题。例如,如果在某一发展中国家里助产士被安排在健康情况最糟糕的农村,那么我们对助产士对健康影响的评估会因没有控制这种非随机指派而产生向下的有偏估计〔见Frankenberg和Thomas(2001)使用前一章讨论过的固定效应分析法(差分法)分析印度尼西亚的数据,获得了正确的估计值〕。类似地,如果(由于未知的原因)不能获得高工资的工人更加可能加入工会的数据,那么对工会会员——这里被看作是“干预”——工资效应的OLS估计将产生向下的有偏估计。作为如何用干预效应方法进行一项研究的有趣例子,见2006年Brand有关工作变换对后续工作质量影响的研究。
1702650702
1702650703
修正内生性问题最显而易见的方法是测量所有被认为影响结果的因素。我们在第6章介绍常规最小二乘回归时用过这种方法,当时我们采取不断增加变量的方法讨论不同模型的情况,目的是评估引入的新变量如何改变模型中已经存在的变量效应。我们在这里看到,内生性偏误是忽略变量偏误的一种形式。
1702650704
1702650705
然而,测量所有潜在地影响结果的变量并不总是可能的:一方面是因为我们是重新分析已经收集好的数据;另一方面是因为分析者不能识别所有对结果有潜在影响的因素,但这些因素与明确测量的变量相关——例如,所有可能使个人加入工会以及与他们作为雇员获得高工资的能力相关的因素。因此,我们需要采用修正内生性偏误(以及它的近亲——样本选择偏误)的方法。我们已经讨论过其中的一种方法——固定效应或随机效应模型,当我们对个体在两个以上的时点进行了测量或对组内(如家庭或教室或社区)不同个体进行了测量时,能够使用此方法。当得不到此类数据时,可以考虑其他几种分析方法,但它们都超出了本书能够涵盖的范围。关于建立因果关系应注意哪些方面,见Holland(1986)以及Rubin、Cox、Glymour和Granger的评论,以及Holland的回应;还有Winship和Morgan(1999)。
1702650706
1702650707
工具变量回归 有一种处理内生性问题的方法在经济学家中非常流行,被称为工具变量(instrumental variable,IV)估计。如果可以找到一个变量(Z),它与影响结果(Y)的未观测变量(u)无关,与模型中被认为和未观测变量相关的变量(X)相关,在控制了观测和未观测变量的作用后与结果变量无关,那么,Z可以被用作X的一个工具变量以获得X对Y效应的相对无偏估计。
1702650708
1702650709
例如,细想1990年发表的一篇文章,Angrist研究了越南战争期间在部队服役对人一生收入的影响。估计OLS方程的难点是,参加部队的决定可能与影响收入的未被测量到的因素相关。Angrist充分利用了一个事实,即在战争期间的多数时间,抽奖系统被用来决定谁将被征召入伍。虽然存在许多特例,但那些抽到小数字的人被征召的概率更大,这使得抽奖数字的指派成为一种自然实验——某人的抽奖数字与服役的可能性相关但不与其他影响服役和随后收入的因素相关。因此,抽奖数字是修正越南老兵身份对收入影响的一个很好的工具变量。
1702650710
1702650711
IV估计很有用的另一种情形是因果顺序模糊不清。假设我们观测到,没有工作的妇女比有工作的妇女更可能精神抑郁。我们能得出就业可以避免抑郁的结论吗?也许可以。但是,因果顺序可能相反:抑郁的妇女很可能不想求职或保持工作。解决这个问题的一种方法是为就业找一个工具变量。一种合理的选择或许是母亲是否曾经工作。众所周知,如果母亲工作,女儿自己也更可能工作。但是,我们没有特殊理由认为,在控制了妇女自己是否工作后,其母亲的就业状况会影响其自身患抑郁症的可能性〔这个例子来自Ettner(2004)〕。因此,母亲工作可以满足作为工具变量的条件。
1702650712
1702650713
IV估计很有用的最后一种情形是估计联立方程模型(simultaneous equation models),或有时候它们被称为互为因果模型(reciprocal causation models)。Wooldridge(2002:555)提供了一个实用的例子:在一个城市样本中,我们预期谋杀率由警力的规模决定——人均警力越多,预期人均谋杀率越低。但是,我们也预期警力的规模由谋杀率决定——(预期的)谋杀率越高,增加警力的动机越强。由于我们只观测均衡的状态——某一特定的谋杀率和某一特定规模的警力——所以识别一个联立方程模型意味着询问一个反事实问题:如果警力的规模不同谋杀率会是多少?如果谋杀率不同警力的规模会是多大?IV方法提供了一种估计此类模型的方法。
1702650714
1702650715
经常涉及互为因果且可以由IV模型(或由后面讨论的结构方程模型)处理的另一种情况是,当某种态度被认为影响另一种态度,但却在同一时间测量它们的时候。与其假设某一种态度由于某些原因而出现于另一种态度之前,不如将它们看作要么共同依赖于第三个变量(第11章曾介绍过的似不相关回归在这种情况下是有帮助的),要么相互影响会更明智。
[
上一页 ]
[ :1.702650666e+09 ]
[
下一页 ]