打字猴:1.702650692e+09
1702650692
1702650693 为了体会多层分析的优势,我们以Lee和Bryk在1989年发表的一篇文章为例,他们分析了高中学校在课程组织上的差异对标准数学测验成绩分布的影响。这篇文章是多层分析标准教材(Raudenbush and Bryk,2002)的作者之一写的,不仅提供了令人信服的实际例子,而且以非常清楚的方式讲述了一些技术问题。使用来自高中及以上(High School and Beyond)学校研究项目的数据(160所高中的10187名学生),Lee和Bryk证明,与有多种课程和多种选择的“大型购物中心”式的学校相比,在对所有学生有标准课程要求的学校中,学习成绩趋向最高,不同种族和社会经济地位的学生差别最小。他们引用这种课程组织上的差异作为天主教学校趋向更加成功的主要原因,尽管这一现象众所周知,但我们以前没有很好地理解。
1702650694
1702650695 我们有多种方法来进行多层分析,包括在第10章讨论的例子中Treiman和Yip(1989)用来讲解回归诊断方法的元分析方法(meta-analysis)。技术细节已经超出了本书的范围。DiPrete和Forristal(1994)的一篇文章对此做了很好的介绍,他们强调实际应用,并介绍了这些技术可以用来做什么研究。Mason(2001)的一篇文章对各类多层分析方法给予了关注,这些方法用来处理因聚集在较高层分析单元(如家庭中的孩子、教室内的学生)内而不独立的观察值。也有几本教材主要介绍多层分析,其中Raudenbush和Bryk(2002)的教材是标准教材,但对技术要求较高,Goldstein(2003)的教材也类似;Snijders和Bosker(1999)的书则相对容易。其他的实际应用例子,见Entwisle和Mason(1985)关于社会经济发展水平与生育率之间关系的研究,DiPrete和Grusky(1990a;1990b)及Grusky和DiPrete(1990)关于美国社会经济地位获得的时期变化研究,以及Sampson、Raudenbush和Earls(1997)关于社区功能在减少犯罪方面作用的研究。
1702650696
1702650697 内生性、样本选择偏误及其他影响正确因果推论的因素
1702650698
1702650699 在这一节,我讨论几种密切相关的情况,它们要求通过特殊处理来避免有偏估计。我也简要介绍一些前几章没有提到的标准解决方法。
1702650700
1702650701 干预效应(treatment effects) 内生性(endogeneity)是指一个或多个预测变量与影响结果的未观测变量相关的情形。因为未观测变量的效应被归因于误差项,所以与这些未观测变量相关的预测变量的系数是有偏的。一种常见的情形是,我们想评估某一干预效应,但这个效应本身就依赖于未被观测到的因素,且这些因素又影响了结果,这就会产生内生性问题。例如,如果在某一发展中国家里助产士被安排在健康情况最糟糕的农村,那么我们对助产士对健康影响的评估会因没有控制这种非随机指派而产生向下的有偏估计〔见Frankenberg和Thomas(2001)使用前一章讨论过的固定效应分析法(差分法)分析印度尼西亚的数据,获得了正确的估计值〕。类似地,如果(由于未知的原因)不能获得高工资的工人更加可能加入工会的数据,那么对工会会员——这里被看作是“干预”——工资效应的OLS估计将产生向下的有偏估计。作为如何用干预效应方法进行一项研究的有趣例子,见2006年Brand有关工作变换对后续工作质量影响的研究。
1702650702
1702650703 修正内生性问题最显而易见的方法是测量所有被认为影响结果的因素。我们在第6章介绍常规最小二乘回归时用过这种方法,当时我们采取不断增加变量的方法讨论不同模型的情况,目的是评估引入的新变量如何改变模型中已经存在的变量效应。我们在这里看到,内生性偏误是忽略变量偏误的一种形式。
1702650704
1702650705 然而,测量所有潜在地影响结果的变量并不总是可能的:一方面是因为我们是重新分析已经收集好的数据;另一方面是因为分析者不能识别所有对结果有潜在影响的因素,但这些因素与明确测量的变量相关——例如,所有可能使个人加入工会以及与他们作为雇员获得高工资的能力相关的因素。因此,我们需要采用修正内生性偏误(以及它的近亲——样本选择偏误)的方法。我们已经讨论过其中的一种方法——固定效应或随机效应模型,当我们对个体在两个以上的时点进行了测量或对组内(如家庭或教室或社区)不同个体进行了测量时,能够使用此方法。当得不到此类数据时,可以考虑其他几种分析方法,但它们都超出了本书能够涵盖的范围。关于建立因果关系应注意哪些方面,见Holland(1986)以及Rubin、Cox、Glymour和Granger的评论,以及Holland的回应;还有Winship和Morgan(1999)。
1702650706
1702650707 工具变量回归 有一种处理内生性问题的方法在经济学家中非常流行,被称为工具变量(instrumental variable,IV)估计。如果可以找到一个变量(Z),它与影响结果(Y)的未观测变量(u)无关,与模型中被认为和未观测变量相关的变量(X)相关,在控制了观测和未观测变量的作用后与结果变量无关,那么,Z可以被用作X的一个工具变量以获得X对Y效应的相对无偏估计。
1702650708
1702650709 例如,细想1990年发表的一篇文章,Angrist研究了越南战争期间在部队服役对人一生收入的影响。估计OLS方程的难点是,参加部队的决定可能与影响收入的未被测量到的因素相关。Angrist充分利用了一个事实,即在战争期间的多数时间,抽奖系统被用来决定谁将被征召入伍。虽然存在许多特例,但那些抽到小数字的人被征召的概率更大,这使得抽奖数字的指派成为一种自然实验——某人的抽奖数字与服役的可能性相关但不与其他影响服役和随后收入的因素相关。因此,抽奖数字是修正越南老兵身份对收入影响的一个很好的工具变量。
1702650710
1702650711 IV估计很有用的另一种情形是因果顺序模糊不清。假设我们观测到,没有工作的妇女比有工作的妇女更可能精神抑郁。我们能得出就业可以避免抑郁的结论吗?也许可以。但是,因果顺序可能相反:抑郁的妇女很可能不想求职或保持工作。解决这个问题的一种方法是为就业找一个工具变量。一种合理的选择或许是母亲是否曾经工作。众所周知,如果母亲工作,女儿自己也更可能工作。但是,我们没有特殊理由认为,在控制了妇女自己是否工作后,其母亲的就业状况会影响其自身患抑郁症的可能性〔这个例子来自Ettner(2004)〕。因此,母亲工作可以满足作为工具变量的条件。
1702650712
1702650713 IV估计很有用的最后一种情形是估计联立方程模型(simultaneous equation models),或有时候它们被称为互为因果模型(reciprocal causation models)。Wooldridge(2002:555)提供了一个实用的例子:在一个城市样本中,我们预期谋杀率由警力的规模决定——人均警力越多,预期人均谋杀率越低。但是,我们也预期警力的规模由谋杀率决定——(预期的)谋杀率越高,增加警力的动机越强。由于我们只观测均衡的状态——某一特定的谋杀率和某一特定规模的警力——所以识别一个联立方程模型意味着询问一个反事实问题:如果警力的规模不同谋杀率会是多少?如果谋杀率不同警力的规模会是多大?IV方法提供了一种估计此类模型的方法。
1702650714
1702650715 经常涉及互为因果且可以由IV模型(或由后面讨论的结构方程模型)处理的另一种情况是,当某种态度被认为影响另一种态度,但却在同一时间测量它们的时候。与其假设某一种态度由于某些原因而出现于另一种态度之前,不如将它们看作要么共同依赖于第三个变量(第11章曾介绍过的似不相关回归在这种情况下是有帮助的),要么相互影响会更明智。
1702650716
1702650717 IV估计的难点是常常很难找到好的工具变量,而不好的工具变量经常带来比根本不用工具变量更糟的估计结果(更大的偏误)。关于IV估计及其危险性的很好的介绍,见Wooldridge(2006,Chapters 15 and 16)。其他有用的参考文献包括Baum(2006)、StataCorp(2007)的命令条目-ivregress-,以及Green(2008)。
1702650718
1702650719 样本选择偏误 当与某一结果相关的未被测量到的因素决定某一个体是否被包括在样本中时,就会出现样本选择偏误(sample-selection bias)。例如,妇女也许只有在能够获得合理的高工资情况下才会进入劳动力市场。因此,个体是否被包含在样本(劳动力市场中的人群)里是非随机的,而且依赖与结果变量(工资)相关的未被测量到的特征。只分析有工资的人就会导致有偏估计。
1702650720
1702650721 我们来看另一个例子。在中国,许多调查都限定于城镇户籍人口。如Wu和Treiman(2007)所展示的,在那些研究中代际流动被高估,因为那些在农村出生而获得城镇户籍的人不是农村人口的随机样本,而是农村人口中“最优秀、最聪明的”人,他们经历了长距离向上的社会流动。如果全部人口都被包括在分析中,流动程度的估计值会更加适中。
1702650722
1702650723 Heckman选择模型 修正样本选择偏误(在不可能像Wu和Treiman那样重新定义人口的情况下)的一种标准方法是使用Heckman矫正法(Heckman correction procedure)(见Heckman,1979)。此方法包括(用一个二分probit方程)预测进入样本的概率(或等价地,具有某种观测结果的概率),计算每个被观测到的期望误差,并且把这些误差作为自变量纳入预测研究结果的方程。有关此方法非常清楚的讲解以及有关样本选择偏误的其他模型,见Winship和Mare(1992),将这些方法扩展到二分结果变量模型的文献可见Dubin和Rivers(1989)。
1702650724
1702650725 -heckman-命令的Stata条目(StataCorp,2007)用经典的例子——妇女的收入,对此方法进行了另一种非常清晰的讲解。在例子中,收入(针对有收入的妇女)由受教育程度和年龄预测,而有收入的概率由婚姻状态、家中孩子数、受教育程度、年龄(且隐含地——通过包括受教育程度和年龄变量的预测结果——由期望工资本身)预测。注意,这里的假设是婚姻状态和家中孩子数不影响收入,但影响获得收入的概率。我们可以质疑这个假设,因为已婚妇女,尤其是家中有孩子的妇女可能选择较低收入的工作,因为这种工作更容易满足她们既工作又做母亲的双重角色。
1702650726
1702650727 因此,这个例子暴露出此方法的一个重要缺陷。为了产生稳健结果,选择方程中的预测变量应该对被选取的概率有显著影响但对结果没有净影响。(当不存在这类变量时,仍可以使用Heckman矫正法,但它依赖对方程函数形式的假定来识别模型。然而,结果常常既不稳健也不特别具有说服力。)我们经常难以找到合适的变量。注意,这与前面讨论过的IV估计具有相似性。
1702650728
1702650729 关于修正样本选择偏误具有教学意义的应用,可见Mare和Winship在1984年对年轻的黑人和白人男性就业趋势的研究;Hagan对影响犯罪处罚程度的因素研究(Peterson and Hagan,1984;Hagan and Parker,1985;Zatz and Hagan,1985);Manski和Wise(1983)对大学毕业的决定因素研究;以及Hardy(1989)基于多次普查的匹配数据对19世纪职业流动的研究,他考虑了因死亡、迁移和姓名变化的选择性。
1702650730
1702650731 内生变换回归 注意,作为IV估计的一种替代方法,Heckman方法也可以用来分析内生性干预效应(endogenous treatment effects)。此时,除了-heckman-命令之外,在Stata中也可以使用独立的-treatreg-命令。内生性干预效应的问题——在指派进入“干预”组与影响结果的未被测量到的因素之间存在非零的相关关系——可相应地被一般化为以下情况,即联系干预和结果的模型参数在不同干预组之间不同,并且进入干预组的指派方法是内生性的。例如,Gerber(2000)研究前共产党员在俄罗斯时代比其他人过得好是否由于遗留的社会资本(这是基于社会联系继续有利于前党员这样的事实),或是由于一些未被测量到的因素同时影响了人们在苏联时代入党的可能性以及在俄罗斯时代获得的收入。
1702650732
1702650733 这类问题可以用类似于处理干预效应和样本选择问题的方法解决——更具体地说是内生变换回归模型(endogenous switching regression models)。内生变换回归模型被用于下面的情形:如果某一选择变量Z=0,我们观测到结果Y1;而如果Z=1,我们则观测到不同的结果Y2。使用这种方法,Gerber得出结论,前共产主义者具有优势完全是由于与成为共产党员相关的未被测量到的特征,而不是由于苏联时代社会和政治资本的延续影响〔也可见Rona-Tas和Guseva(2001)的评论,以及Gerber(2001)的回应〕。
1702650734
1702650735 关于此技术的介绍和如何应用的精彩描述可以在Mare和Winship(1988)及Powers(1993)的文献中找到。其他应用可见Willis和Rosen(1979),Gamoran和Mare(1989),Long(1990),Sakamoto和Chen(1991),Manski等(1992),Tienda和Wilson(1992),Powers和Ellison(1995),Smock、Manning和Gupta(1999),Hofmeyr和Lucas(2001),Lichter、McLaughlin和Ribar(2002),Sousa-Poza(2004),以及Prouteau和Wolff(2006)的研究。
1702650736
1702650737 倾向分匹配 当研究的预测变量在样本中极少出现但与其他自变量高度相关时,进行正确的因果推论会遇到另一个问题。例如,上精英大学对今后职业地位的影响是什么?解决这类问题的通常做法是对上精英大学与上其他大学相比较的职业地位进行多元回归,加上一组控制家庭背景、高中成绩等的变量。难点在于:能否上精英大学与控制变量高度相关,控制这些复杂因素并不能使它们保持不变,因为有一些控制变量取值较低的人也能上精英大学。这里,除了产生“保持不变”含义的概念问题外,还有一个严重的统计问题——“不平衡干预”(unbalanced treatments)会使标准误增大(Rosenbaum and Rubin,1983:48),导致难以拒绝没有效用的零假设。为了解决这个问题,分析者有时候会求助于配对样本,这些样本在研究变量(即“干预”变量)上不同,但在一组协变量上取值一致。但是,像Smith(1997:326-327)所解释的那样,直到最近为止,匹配研究因为“丢弃”(throwing away)大量数据而受到抵制。此外,变量稍微多一点就常常很难找到好的匹配,因为协变量数量的线性增加要求匹配数量成几何级增长。
1702650738
1702650739 但是,匹配统计理论的发展——源自Rosenbaum和Rubin(1983)的开创性论文——已经促进了一种方法的发展,即用倾向分(propensity score)取代经典匹配方法所要求的一大批离散匹配。倾向分是对个案之间在大量的协变量方面相似程度的数量概括。步骤包括通过协变量预测干预变量,然后把每个“干预”个案与倾向分最接近的控制个案匹配〔或有时候与几个控制个案匹配;见Morgan和Winship(2007)对有关技术问题的有益的讨论〕。由此得到的样本可以用下面方法中的一种分析:忽略不能匹配的个案,致力于匹配了的干预与控制个案之间的结果差异;将个案分成具有相似倾向分的层,并在层中比较结果〔可参见Brand和Xie(2007)对该方法的有趣应用〕;或者,把倾向分直接纳入回归方程,以得到在控制了进入“干预组”的可能性后对干预效应的估计。关键点是,通过比较具有相似进入干预组倾向的个案,我们创建了一个准实验(quasi experiment)。也就是说,我们实际上可将匹配样本看作被随机地指派为干预组或控制组,因为在给定协变量后,它们在进入任何一组方面有同样的概率。
1702650740
1702650741 借用Smith(1997)在介绍匹配方法时用的例子。他的兴趣在于比较两类医院——常规医院(N=5053)和“特殊”(magnet)医院(N=39)——的死亡率,后者通过有组织的实践来提高它们的声誉,被认为是护理实践的好地方。通过比较OLS分析与倾向分匹配方法,他展示了两种方法在两类医院的死亡率差异上有相似的估计值,但是,后一种方法的标准误远远小于前者。因此,根据倾向分匹配方法,特殊医院的死亡率比常规医院的死亡率在统计上显著降低,而OLS分析因不平衡设计产生了极大的标准误而不能得出该结论。
[ 上一页 ]  [ :1.702650692e+09 ]  [ 下一页 ]