打字猴:1.702650682e+09

1702650682

1702650683 Yij=aj+bjXij+εij　　　　　　（16.5）

1702650684

1702650685 其中

1702650686

1702650687 aj=η00+η01Gj+α0j

1702650688

1702650689 bj=η10+η11Gj+α1j　　　　　　（16.6）

1702650690

1702650691 这里，j=1，2，…，J代表环境，或层-2的分析单元（此例指学校系统），且I=1，2，…，nj代表环境内的个体（层-1的分析单元）。层-2方程明确表明，层-1的截距项和斜率都是G的线性函数，即随环境不同而变化〔或者，在这个例子中，当学费较高时，兄弟姐妹数对应的（负）斜率（在绝对值上）比较大；在此例中，我对层-1方程的截距项没有提出任何假设，但我们可以设想当学费很高时教育获得水平较低〕。当然，层-1方程可以包括一个以上的X变量，而层-2方程可以包括一个以上的G变量。

1702650692

1702650693 为了体会多层分析的优势，我们以Lee和Bryk在1989年发表的一篇文章为例，他们分析了高中学校在课程组织上的差异对标准数学测验成绩分布的影响。这篇文章是多层分析标准教材（Raudenbush and Bryk，2002）的作者之一写的，不仅提供了令人信服的实际例子，而且以非常清楚的方式讲述了一些技术问题。使用来自高中及以上（High School and Beyond）学校研究项目的数据（160所高中的10187名学生），Lee和Bryk证明，与有多种课程和多种选择的“大型购物中心”式的学校相比，在对所有学生有标准课程要求的学校中，学习成绩趋向最高，不同种族和社会经济地位的学生差别最小。他们引用这种课程组织上的差异作为天主教学校趋向更加成功的主要原因，尽管这一现象众所周知，但我们以前没有很好地理解。

1702650694

1702650695 我们有多种方法来进行多层分析，包括在第10章讨论的例子中Treiman和Yip（1989）用来讲解回归诊断方法的元分析方法（meta-analysis）。技术细节已经超出了本书的范围。DiPrete和Forristal（1994）的一篇文章对此做了很好的介绍，他们强调实际应用，并介绍了这些技术可以用来做什么研究。Mason（2001）的一篇文章对各类多层分析方法给予了关注，这些方法用来处理因聚集在较高层分析单元（如家庭中的孩子、教室内的学生）内而不独立的观察值。也有几本教材主要介绍多层分析，其中Raudenbush和Bryk（2002）的教材是标准教材，但对技术要求较高，Goldstein（2003）的教材也类似；Snijders和Bosker（1999）的书则相对容易。其他的实际应用例子，见Entwisle和Mason（1985）关于社会经济发展水平与生育率之间关系的研究，DiPrete和Grusky（1990a；1990b）及Grusky和DiPrete（1990）关于美国社会经济地位获得的时期变化研究，以及Sampson、Raudenbush和Earls（1997）关于社区功能在减少犯罪方面作用的研究。

1702650696

1702650697 内生性、样本选择偏误及其他影响正确因果推论的因素

1702650698

1702650699 在这一节，我讨论几种密切相关的情况，它们要求通过特殊处理来避免有偏估计。我也简要介绍一些前几章没有提到的标准解决方法。

1702650700

1702650701 干预效应（treatment effects）内生性（endogeneity）是指一个或多个预测变量与影响结果的未观测变量相关的情形。因为未观测变量的效应被归因于误差项，所以与这些未观测变量相关的预测变量的系数是有偏的。一种常见的情形是，我们想评估某一干预效应，但这个效应本身就依赖于未被观测到的因素，且这些因素又影响了结果，这就会产生内生性问题。例如，如果在某一发展中国家里助产士被安排在健康情况最糟糕的农村，那么我们对助产士对健康影响的评估会因没有控制这种非随机指派而产生向下的有偏估计〔见Frankenberg和Thomas（2001）使用前一章讨论过的固定效应分析法（差分法）分析印度尼西亚的数据，获得了正确的估计值〕。类似地，如果（由于未知的原因）不能获得高工资的工人更加可能加入工会的数据，那么对工会会员——这里被看作是“干预”——工资效应的OLS估计将产生向下的有偏估计。作为如何用干预效应方法进行一项研究的有趣例子，见2006年Brand有关工作变换对后续工作质量影响的研究。

1702650702

1702650703 修正内生性问题最显而易见的方法是测量所有被认为影响结果的因素。我们在第6章介绍常规最小二乘回归时用过这种方法，当时我们采取不断增加变量的方法讨论不同模型的情况，目的是评估引入的新变量如何改变模型中已经存在的变量效应。我们在这里看到，内生性偏误是忽略变量偏误的一种形式。

1702650704

1702650705 然而，测量所有潜在地影响结果的变量并不总是可能的：一方面是因为我们是重新分析已经收集好的数据；另一方面是因为分析者不能识别所有对结果有潜在影响的因素，但这些因素与明确测量的变量相关——例如，所有可能使个人加入工会以及与他们作为雇员获得高工资的能力相关的因素。因此，我们需要采用修正内生性偏误（以及它的近亲——样本选择偏误）的方法。我们已经讨论过其中的一种方法——固定效应或随机效应模型，当我们对个体在两个以上的时点进行了测量或对组内（如家庭或教室或社区）不同个体进行了测量时，能够使用此方法。当得不到此类数据时，可以考虑其他几种分析方法，但它们都超出了本书能够涵盖的范围。关于建立因果关系应注意哪些方面，见Holland（1986）以及Rubin、Cox、Glymour和Granger的评论，以及Holland的回应；还有Winship和Morgan（1999）。

1702650706

1702650707 工具变量回归有一种处理内生性问题的方法在经济学家中非常流行，被称为工具变量（instrumental variable，IV）估计。如果可以找到一个变量（Z），它与影响结果（Y）的未观测变量（u）无关，与模型中被认为和未观测变量相关的变量（X）相关，在控制了观测和未观测变量的作用后与结果变量无关，那么，Z可以被用作X的一个工具变量以获得X对Y效应的相对无偏估计。

1702650708

1702650709 例如，细想1990年发表的一篇文章，Angrist研究了越南战争期间在部队服役对人一生收入的影响。估计OLS方程的难点是，参加部队的决定可能与影响收入的未被测量到的因素相关。Angrist充分利用了一个事实，即在战争期间的多数时间，抽奖系统被用来决定谁将被征召入伍。虽然存在许多特例，但那些抽到小数字的人被征召的概率更大，这使得抽奖数字的指派成为一种自然实验——某人的抽奖数字与服役的可能性相关但不与其他影响服役和随后收入的因素相关。因此，抽奖数字是修正越南老兵身份对收入影响的一个很好的工具变量。

1702650710

1702650711 IV估计很有用的另一种情形是因果顺序模糊不清。假设我们观测到，没有工作的妇女比有工作的妇女更可能精神抑郁。我们能得出就业可以避免抑郁的结论吗？也许可以。但是，因果顺序可能相反：抑郁的妇女很可能不想求职或保持工作。解决这个问题的一种方法是为就业找一个工具变量。一种合理的选择或许是母亲是否曾经工作。众所周知，如果母亲工作，女儿自己也更可能工作。但是，我们没有特殊理由认为，在控制了妇女自己是否工作后，其母亲的就业状况会影响其自身患抑郁症的可能性〔这个例子来自Ettner（2004）〕。因此，母亲工作可以满足作为工具变量的条件。

1702650712

1702650713 IV估计很有用的最后一种情形是估计联立方程模型（simultaneous equation models），或有时候它们被称为互为因果模型（reciprocal causation models）。Wooldridge（2002：555）提供了一个实用的例子：在一个城市样本中，我们预期谋杀率由警力的规模决定——人均警力越多，预期人均谋杀率越低。但是，我们也预期警力的规模由谋杀率决定——（预期的）谋杀率越高，增加警力的动机越强。由于我们只观测均衡的状态——某一特定的谋杀率和某一特定规模的警力——所以识别一个联立方程模型意味着询问一个反事实问题：如果警力的规模不同谋杀率会是多少？如果谋杀率不同警力的规模会是多大？IV方法提供了一种估计此类模型的方法。

1702650714

1702650715 经常涉及互为因果且可以由IV模型（或由后面讨论的结构方程模型）处理的另一种情况是，当某种态度被认为影响另一种态度，但却在同一时间测量它们的时候。与其假设某一种态度由于某些原因而出现于另一种态度之前，不如将它们看作要么共同依赖于第三个变量（第11章曾介绍过的似不相关回归在这种情况下是有帮助的），要么相互影响会更明智。

1702650716

1702650717 IV估计的难点是常常很难找到好的工具变量，而不好的工具变量经常带来比根本不用工具变量更糟的估计结果（更大的偏误）。关于IV估计及其危险性的很好的介绍，见Wooldridge（2006，Chapters 15 and 16）。其他有用的参考文献包括Baum（2006）、StataCorp（2007）的命令条目-ivregress-，以及Green（2008）。

1702650718

1702650719 样本选择偏误当与某一结果相关的未被测量到的因素决定某一个体是否被包括在样本中时，就会出现样本选择偏误（sample-selection bias）。例如，妇女也许只有在能够获得合理的高工资情况下才会进入劳动力市场。因此，个体是否被包含在样本（劳动力市场中的人群）里是非随机的，而且依赖与结果变量（工资）相关的未被测量到的特征。只分析有工资的人就会导致有偏估计。

1702650720

1702650721 我们来看另一个例子。在中国，许多调查都限定于城镇户籍人口。如Wu和Treiman（2007）所展示的，在那些研究中代际流动被高估，因为那些在农村出生而获得城镇户籍的人不是农村人口的随机样本，而是农村人口中“最优秀、最聪明的”人，他们经历了长距离向上的社会流动。如果全部人口都被包括在分析中，流动程度的估计值会更加适中。

1702650722

1702650723 Heckman选择模型修正样本选择偏误（在不可能像Wu和Treiman那样重新定义人口的情况下）的一种标准方法是使用Heckman矫正法（Heckman correction procedure）（见Heckman，1979）。此方法包括（用一个二分probit方程）预测进入样本的概率（或等价地，具有某种观测结果的概率），计算每个被观测到的期望误差，并且把这些误差作为自变量纳入预测研究结果的方程。有关此方法非常清楚的讲解以及有关样本选择偏误的其他模型，见Winship和Mare（1992），将这些方法扩展到二分结果变量模型的文献可见Dubin和Rivers（1989）。

1702650724

1702650725 -heckman-命令的Stata条目（StataCorp，2007）用经典的例子——妇女的收入，对此方法进行了另一种非常清晰的讲解。在例子中，收入（针对有收入的妇女）由受教育程度和年龄预测，而有收入的概率由婚姻状态、家中孩子数、受教育程度、年龄（且隐含地——通过包括受教育程度和年龄变量的预测结果——由期望工资本身）预测。注意，这里的假设是婚姻状态和家中孩子数不影响收入，但影响获得收入的概率。我们可以质疑这个假设，因为已婚妇女，尤其是家中有孩子的妇女可能选择较低收入的工作，因为这种工作更容易满足她们既工作又做母亲的双重角色。

1702650726

1702650727 因此，这个例子暴露出此方法的一个重要缺陷。为了产生稳健结果，选择方程中的预测变量应该对被选取的概率有显著影响但对结果没有净影响。（当不存在这类变量时，仍可以使用Heckman矫正法，但它依赖对方程函数形式的假定来识别模型。然而，结果常常既不稳健也不特别具有说服力。）我们经常难以找到合适的变量。注意，这与前面讨论过的IV估计具有相似性。

1702650728

1702650729 关于修正样本选择偏误具有教学意义的应用，可见Mare和Winship在1984年对年轻的黑人和白人男性就业趋势的研究；Hagan对影响犯罪处罚程度的因素研究（Peterson and Hagan，1984；Hagan and Parker，1985；Zatz and Hagan，1985）；Manski和Wise（1983）对大学毕业的决定因素研究；以及Hardy（1989）基于多次普查的匹配数据对19世纪职业流动的研究，他考虑了因死亡、迁移和姓名变化的选择性。

1702650730

1702650731 内生变换回归注意，作为IV估计的一种替代方法，Heckman方法也可以用来分析内生性干预效应（endogenous treatment effects）。此时，除了-heckman-命令之外，在Stata中也可以使用独立的-treatreg-命令。内生性干预效应的问题——在指派进入“干预”组与影响结果的未被测量到的因素之间存在非零的相关关系——可相应地被一般化为以下情况，即联系干预和结果的模型参数在不同干预组之间不同，并且进入干预组的指派方法是内生性的。例如，Gerber（2000）研究前共产党员在俄罗斯时代比其他人过得好是否由于遗留的社会资本（这是基于社会联系继续有利于前党员这样的事实），或是由于一些未被测量到的因素同时影响了人们在苏联时代入党的可能性以及在俄罗斯时代获得的收入。

[ 上一页 ] [ :1.702650682e+09 ] [ 下一页 ]