1702650708
1702650709
例如,细想1990年发表的一篇文章,Angrist研究了越南战争期间在部队服役对人一生收入的影响。估计OLS方程的难点是,参加部队的决定可能与影响收入的未被测量到的因素相关。Angrist充分利用了一个事实,即在战争期间的多数时间,抽奖系统被用来决定谁将被征召入伍。虽然存在许多特例,但那些抽到小数字的人被征召的概率更大,这使得抽奖数字的指派成为一种自然实验——某人的抽奖数字与服役的可能性相关但不与其他影响服役和随后收入的因素相关。因此,抽奖数字是修正越南老兵身份对收入影响的一个很好的工具变量。
1702650710
1702650711
IV估计很有用的另一种情形是因果顺序模糊不清。假设我们观测到,没有工作的妇女比有工作的妇女更可能精神抑郁。我们能得出就业可以避免抑郁的结论吗?也许可以。但是,因果顺序可能相反:抑郁的妇女很可能不想求职或保持工作。解决这个问题的一种方法是为就业找一个工具变量。一种合理的选择或许是母亲是否曾经工作。众所周知,如果母亲工作,女儿自己也更可能工作。但是,我们没有特殊理由认为,在控制了妇女自己是否工作后,其母亲的就业状况会影响其自身患抑郁症的可能性〔这个例子来自Ettner(2004)〕。因此,母亲工作可以满足作为工具变量的条件。
1702650712
1702650713
IV估计很有用的最后一种情形是估计联立方程模型(simultaneous equation models),或有时候它们被称为互为因果模型(reciprocal causation models)。Wooldridge(2002:555)提供了一个实用的例子:在一个城市样本中,我们预期谋杀率由警力的规模决定——人均警力越多,预期人均谋杀率越低。但是,我们也预期警力的规模由谋杀率决定——(预期的)谋杀率越高,增加警力的动机越强。由于我们只观测均衡的状态——某一特定的谋杀率和某一特定规模的警力——所以识别一个联立方程模型意味着询问一个反事实问题:如果警力的规模不同谋杀率会是多少?如果谋杀率不同警力的规模会是多大?IV方法提供了一种估计此类模型的方法。
1702650714
1702650715
经常涉及互为因果且可以由IV模型(或由后面讨论的结构方程模型)处理的另一种情况是,当某种态度被认为影响另一种态度,但却在同一时间测量它们的时候。与其假设某一种态度由于某些原因而出现于另一种态度之前,不如将它们看作要么共同依赖于第三个变量(第11章曾介绍过的似不相关回归在这种情况下是有帮助的),要么相互影响会更明智。
1702650716
1702650717
IV估计的难点是常常很难找到好的工具变量,而不好的工具变量经常带来比根本不用工具变量更糟的估计结果(更大的偏误)。关于IV估计及其危险性的很好的介绍,见Wooldridge(2006,Chapters 15 and 16)。其他有用的参考文献包括Baum(2006)、StataCorp(2007)的命令条目-ivregress-,以及Green(2008)。
1702650718
1702650719
样本选择偏误 当与某一结果相关的未被测量到的因素决定某一个体是否被包括在样本中时,就会出现样本选择偏误(sample-selection bias)。例如,妇女也许只有在能够获得合理的高工资情况下才会进入劳动力市场。因此,个体是否被包含在样本(劳动力市场中的人群)里是非随机的,而且依赖与结果变量(工资)相关的未被测量到的特征。只分析有工资的人就会导致有偏估计。
1702650720
1702650721
我们来看另一个例子。在中国,许多调查都限定于城镇户籍人口。如Wu和Treiman(2007)所展示的,在那些研究中代际流动被高估,因为那些在农村出生而获得城镇户籍的人不是农村人口的随机样本,而是农村人口中“最优秀、最聪明的”人,他们经历了长距离向上的社会流动。如果全部人口都被包括在分析中,流动程度的估计值会更加适中。
1702650722
1702650723
Heckman选择模型 修正样本选择偏误(在不可能像Wu和Treiman那样重新定义人口的情况下)的一种标准方法是使用Heckman矫正法(Heckman correction procedure)(见Heckman,1979)。此方法包括(用一个二分probit方程)预测进入样本的概率(或等价地,具有某种观测结果的概率),计算每个被观测到的期望误差,并且把这些误差作为自变量纳入预测研究结果的方程。有关此方法非常清楚的讲解以及有关样本选择偏误的其他模型,见Winship和Mare(1992),将这些方法扩展到二分结果变量模型的文献可见Dubin和Rivers(1989)。
1702650724
1702650725
-heckman-命令的Stata条目(StataCorp,2007)用经典的例子——妇女的收入,对此方法进行了另一种非常清晰的讲解。在例子中,收入(针对有收入的妇女)由受教育程度和年龄预测,而有收入的概率由婚姻状态、家中孩子数、受教育程度、年龄(且隐含地——通过包括受教育程度和年龄变量的预测结果——由期望工资本身)预测。注意,这里的假设是婚姻状态和家中孩子数不影响收入,但影响获得收入的概率。我们可以质疑这个假设,因为已婚妇女,尤其是家中有孩子的妇女可能选择较低收入的工作,因为这种工作更容易满足她们既工作又做母亲的双重角色。
1702650726
1702650727
因此,这个例子暴露出此方法的一个重要缺陷。为了产生稳健结果,选择方程中的预测变量应该对被选取的概率有显著影响但对结果没有净影响。(当不存在这类变量时,仍可以使用Heckman矫正法,但它依赖对方程函数形式的假定来识别模型。然而,结果常常既不稳健也不特别具有说服力。)我们经常难以找到合适的变量。注意,这与前面讨论过的IV估计具有相似性。
1702650728
1702650729
关于修正样本选择偏误具有教学意义的应用,可见Mare和Winship在1984年对年轻的黑人和白人男性就业趋势的研究;Hagan对影响犯罪处罚程度的因素研究(Peterson and Hagan,1984;Hagan and Parker,1985;Zatz and Hagan,1985);Manski和Wise(1983)对大学毕业的决定因素研究;以及Hardy(1989)基于多次普查的匹配数据对19世纪职业流动的研究,他考虑了因死亡、迁移和姓名变化的选择性。
1702650730
1702650731
内生变换回归 注意,作为IV估计的一种替代方法,Heckman方法也可以用来分析内生性干预效应(endogenous treatment effects)。此时,除了-heckman-命令之外,在Stata中也可以使用独立的-treatreg-命令。内生性干预效应的问题——在指派进入“干预”组与影响结果的未被测量到的因素之间存在非零的相关关系——可相应地被一般化为以下情况,即联系干预和结果的模型参数在不同干预组之间不同,并且进入干预组的指派方法是内生性的。例如,Gerber(2000)研究前共产党员在俄罗斯时代比其他人过得好是否由于遗留的社会资本(这是基于社会联系继续有利于前党员这样的事实),或是由于一些未被测量到的因素同时影响了人们在苏联时代入党的可能性以及在俄罗斯时代获得的收入。
1702650732
1702650733
这类问题可以用类似于处理干预效应和样本选择问题的方法解决——更具体地说是内生变换回归模型(endogenous switching regression models)。内生变换回归模型被用于下面的情形:如果某一选择变量Z=0,我们观测到结果Y1;而如果Z=1,我们则观测到不同的结果Y2。使用这种方法,Gerber得出结论,前共产主义者具有优势完全是由于与成为共产党员相关的未被测量到的特征,而不是由于苏联时代社会和政治资本的延续影响〔也可见Rona-Tas和Guseva(2001)的评论,以及Gerber(2001)的回应〕。
1702650734
1702650735
关于此技术的介绍和如何应用的精彩描述可以在Mare和Winship(1988)及Powers(1993)的文献中找到。其他应用可见Willis和Rosen(1979),Gamoran和Mare(1989),Long(1990),Sakamoto和Chen(1991),Manski等(1992),Tienda和Wilson(1992),Powers和Ellison(1995),Smock、Manning和Gupta(1999),Hofmeyr和Lucas(2001),Lichter、McLaughlin和Ribar(2002),Sousa-Poza(2004),以及Prouteau和Wolff(2006)的研究。
1702650736
1702650737
倾向分匹配 当研究的预测变量在样本中极少出现但与其他自变量高度相关时,进行正确的因果推论会遇到另一个问题。例如,上精英大学对今后职业地位的影响是什么?解决这类问题的通常做法是对上精英大学与上其他大学相比较的职业地位进行多元回归,加上一组控制家庭背景、高中成绩等的变量。难点在于:能否上精英大学与控制变量高度相关,控制这些复杂因素并不能使它们保持不变,因为有一些控制变量取值较低的人也能上精英大学。这里,除了产生“保持不变”含义的概念问题外,还有一个严重的统计问题——“不平衡干预”(unbalanced treatments)会使标准误增大(Rosenbaum and Rubin,1983:48),导致难以拒绝没有效用的零假设。为了解决这个问题,分析者有时候会求助于配对样本,这些样本在研究变量(即“干预”变量)上不同,但在一组协变量上取值一致。但是,像Smith(1997:326-327)所解释的那样,直到最近为止,匹配研究因为“丢弃”(throwing away)大量数据而受到抵制。此外,变量稍微多一点就常常很难找到好的匹配,因为协变量数量的线性增加要求匹配数量成几何级增长。
1702650738
1702650739
但是,匹配统计理论的发展——源自Rosenbaum和Rubin(1983)的开创性论文——已经促进了一种方法的发展,即用倾向分(propensity score)取代经典匹配方法所要求的一大批离散匹配。倾向分是对个案之间在大量的协变量方面相似程度的数量概括。步骤包括通过协变量预测干预变量,然后把每个“干预”个案与倾向分最接近的控制个案匹配〔或有时候与几个控制个案匹配;见Morgan和Winship(2007)对有关技术问题的有益的讨论〕。由此得到的样本可以用下面方法中的一种分析:忽略不能匹配的个案,致力于匹配了的干预与控制个案之间的结果差异;将个案分成具有相似倾向分的层,并在层中比较结果〔可参见Brand和Xie(2007)对该方法的有趣应用〕;或者,把倾向分直接纳入回归方程,以得到在控制了进入“干预组”的可能性后对干预效应的估计。关键点是,通过比较具有相似进入干预组倾向的个案,我们创建了一个准实验(quasi experiment)。也就是说,我们实际上可将匹配样本看作被随机地指派为干预组或控制组,因为在给定协变量后,它们在进入任何一组方面有同样的概率。
1702650740
1702650741
借用Smith(1997)在介绍匹配方法时用的例子。他的兴趣在于比较两类医院——常规医院(N=5053)和“特殊”(magnet)医院(N=39)——的死亡率,后者通过有组织的实践来提高它们的声誉,被认为是护理实践的好地方。通过比较OLS分析与倾向分匹配方法,他展示了两种方法在两类医院的死亡率差异上有相似的估计值,但是,后一种方法的标准误远远小于前者。因此,根据倾向分匹配方法,特殊医院的死亡率比常规医院的死亡率在统计上显著降低,而OLS分析因不平衡设计产生了极大的标准误而不能得出该结论。
1702650742
1702650743
目前,有大量文献讲解倾向分匹配统计理论和应用此方法的实践步骤。Smith发表于1997年的文章是很好的开始,并提供了有用的文献。Becker和Ichino(2002)、Abadie等(2004),以及Becker和Caliendo(2007)讨论了在Stata中如何使用倾向分匹配。Dehejia和Wahba(2002)、Brand和Halaby(2006)提供了有益的评估和具体例子。Harding(2003)提供了一种特别有指导性的应用。其他应用可见Berk和Newton(1985)、Stone等(1995)、Keating等(2001)、Lu等(2001)、Morgan(2001)、Black和Smith(2003)、Lundquist(2004),以及Cohen(2005)。倾向分匹配的一个缺陷是它不能平衡未被观测到的协变量。因此,如果你怀疑存在内生性问题,需要求助于这里讨论的方法之一,或在前一章中专门为解决此类问题设计的方法。
1702650744
1702650745
结构方程模型
1702650746
1702650747
结构方程模型(structural equation modeling,SEM)是可以对方程进行系统估计的一项技术(或准确地讲,一套技术),经常包含未被测量的或潜在的概念(latent constructs)。请看一个简单的例子,即如图16-2所示的Blau和Duncan(1967:170)关于地位获得的经典模型。当我们研究职业地位是如何从一代向下一代传递时,显然这是一个多级过程:父亲受到良好的教育并有地位高的工作,儿子也更可能接受更多的教育;那些受教育程度高的人更可能获得地位高的初职(他们的社会出身也可能起了很大作用);初职地位比较高的人更可能由此进入地位高的现职(他们所受的教育和社会出身可能继续发挥作用)。图16-2显示了父亲的职业地位通过各种“途径”传递给他们的儿子,这被称为“路径图”(path diagram)。路径最终可以由一组预测每种结果的方程表达。通过探索方程间的关系,我们可以判断联系两个变量的不同路径的相对重要性。此外,在某些情况下〔尤其是,如果某特定系数被固定(经常但不是必须)为0,或者两个或更多的系数被限定为相等——也就是说,如果模型被过度识别〕,我们可以评估模型的拟合优度。
1702650748
1702650749
1702650750
1702650751
1702650752
图16-2 Blau和Duncan关于分层过程的基本模型
1702650753
1702650754
资料来源:Blau和Duncan(1967:170)。
1702650755
1702650756
在刚才讨论的模型中,每个变量只有一种测量。然而,分析者经常可以获得被认为代表某个单一隐含或潜在概念的重复测量或一组测量。在这些情况下,我们可以使用SEM对测量误差进行评估和修正。两个早期但很有指导性的例子可见Bielby、Hauser和Featherman(1977)以及Hauser、Tsai和Sewell(1983)。SEM的另一种用法是估计包括互为因果的过程,甚至包括潜在变量。这样的例子可参考Duncan、Haller和Portes(1968)。(注意,刚才所引用文献的发表时间都比较早。这并不是因为缺少最近的研究——当前的相关文献非常多——而是早期研究在模型估计方面比后来结构方程模型被广泛使用之后的文献讲解得更加清楚。因此,出于教学目的,早期的文章更有帮助。)
1702650757
[
上一页 ]
[ :1.702650708e+09 ]
[
下一页 ]