打字猴:1.70265073e+09
1702650730
1702650731 内生变换回归 注意,作为IV估计的一种替代方法,Heckman方法也可以用来分析内生性干预效应(endogenous treatment effects)。此时,除了-heckman-命令之外,在Stata中也可以使用独立的-treatreg-命令。内生性干预效应的问题——在指派进入“干预”组与影响结果的未被测量到的因素之间存在非零的相关关系——可相应地被一般化为以下情况,即联系干预和结果的模型参数在不同干预组之间不同,并且进入干预组的指派方法是内生性的。例如,Gerber(2000)研究前共产党员在俄罗斯时代比其他人过得好是否由于遗留的社会资本(这是基于社会联系继续有利于前党员这样的事实),或是由于一些未被测量到的因素同时影响了人们在苏联时代入党的可能性以及在俄罗斯时代获得的收入。
1702650732
1702650733 这类问题可以用类似于处理干预效应和样本选择问题的方法解决——更具体地说是内生变换回归模型(endogenous switching regression models)。内生变换回归模型被用于下面的情形:如果某一选择变量Z=0,我们观测到结果Y1;而如果Z=1,我们则观测到不同的结果Y2。使用这种方法,Gerber得出结论,前共产主义者具有优势完全是由于与成为共产党员相关的未被测量到的特征,而不是由于苏联时代社会和政治资本的延续影响〔也可见Rona-Tas和Guseva(2001)的评论,以及Gerber(2001)的回应〕。
1702650734
1702650735 关于此技术的介绍和如何应用的精彩描述可以在Mare和Winship(1988)及Powers(1993)的文献中找到。其他应用可见Willis和Rosen(1979),Gamoran和Mare(1989),Long(1990),Sakamoto和Chen(1991),Manski等(1992),Tienda和Wilson(1992),Powers和Ellison(1995),Smock、Manning和Gupta(1999),Hofmeyr和Lucas(2001),Lichter、McLaughlin和Ribar(2002),Sousa-Poza(2004),以及Prouteau和Wolff(2006)的研究。
1702650736
1702650737 倾向分匹配 当研究的预测变量在样本中极少出现但与其他自变量高度相关时,进行正确的因果推论会遇到另一个问题。例如,上精英大学对今后职业地位的影响是什么?解决这类问题的通常做法是对上精英大学与上其他大学相比较的职业地位进行多元回归,加上一组控制家庭背景、高中成绩等的变量。难点在于:能否上精英大学与控制变量高度相关,控制这些复杂因素并不能使它们保持不变,因为有一些控制变量取值较低的人也能上精英大学。这里,除了产生“保持不变”含义的概念问题外,还有一个严重的统计问题——“不平衡干预”(unbalanced treatments)会使标准误增大(Rosenbaum and Rubin,1983:48),导致难以拒绝没有效用的零假设。为了解决这个问题,分析者有时候会求助于配对样本,这些样本在研究变量(即“干预”变量)上不同,但在一组协变量上取值一致。但是,像Smith(1997:326-327)所解释的那样,直到最近为止,匹配研究因为“丢弃”(throwing away)大量数据而受到抵制。此外,变量稍微多一点就常常很难找到好的匹配,因为协变量数量的线性增加要求匹配数量成几何级增长。
1702650738
1702650739 但是,匹配统计理论的发展——源自Rosenbaum和Rubin(1983)的开创性论文——已经促进了一种方法的发展,即用倾向分(propensity score)取代经典匹配方法所要求的一大批离散匹配。倾向分是对个案之间在大量的协变量方面相似程度的数量概括。步骤包括通过协变量预测干预变量,然后把每个“干预”个案与倾向分最接近的控制个案匹配〔或有时候与几个控制个案匹配;见Morgan和Winship(2007)对有关技术问题的有益的讨论〕。由此得到的样本可以用下面方法中的一种分析:忽略不能匹配的个案,致力于匹配了的干预与控制个案之间的结果差异;将个案分成具有相似倾向分的层,并在层中比较结果〔可参见Brand和Xie(2007)对该方法的有趣应用〕;或者,把倾向分直接纳入回归方程,以得到在控制了进入“干预组”的可能性后对干预效应的估计。关键点是,通过比较具有相似进入干预组倾向的个案,我们创建了一个准实验(quasi experiment)。也就是说,我们实际上可将匹配样本看作被随机地指派为干预组或控制组,因为在给定协变量后,它们在进入任何一组方面有同样的概率。
1702650740
1702650741 借用Smith(1997)在介绍匹配方法时用的例子。他的兴趣在于比较两类医院——常规医院(N=5053)和“特殊”(magnet)医院(N=39)——的死亡率,后者通过有组织的实践来提高它们的声誉,被认为是护理实践的好地方。通过比较OLS分析与倾向分匹配方法,他展示了两种方法在两类医院的死亡率差异上有相似的估计值,但是,后一种方法的标准误远远小于前者。因此,根据倾向分匹配方法,特殊医院的死亡率比常规医院的死亡率在统计上显著降低,而OLS分析因不平衡设计产生了极大的标准误而不能得出该结论。
1702650742
1702650743 目前,有大量文献讲解倾向分匹配统计理论和应用此方法的实践步骤。Smith发表于1997年的文章是很好的开始,并提供了有用的文献。Becker和Ichino(2002)、Abadie等(2004),以及Becker和Caliendo(2007)讨论了在Stata中如何使用倾向分匹配。Dehejia和Wahba(2002)、Brand和Halaby(2006)提供了有益的评估和具体例子。Harding(2003)提供了一种特别有指导性的应用。其他应用可见Berk和Newton(1985)、Stone等(1995)、Keating等(2001)、Lu等(2001)、Morgan(2001)、Black和Smith(2003)、Lundquist(2004),以及Cohen(2005)。倾向分匹配的一个缺陷是它不能平衡未被观测到的协变量。因此,如果你怀疑存在内生性问题,需要求助于这里讨论的方法之一,或在前一章中专门为解决此类问题设计的方法。
1702650744
1702650745 结构方程模型
1702650746
1702650747 结构方程模型(structural equation modeling,SEM)是可以对方程进行系统估计的一项技术(或准确地讲,一套技术),经常包含未被测量的或潜在的概念(latent constructs)。请看一个简单的例子,即如图16-2所示的Blau和Duncan(1967:170)关于地位获得的经典模型。当我们研究职业地位是如何从一代向下一代传递时,显然这是一个多级过程:父亲受到良好的教育并有地位高的工作,儿子也更可能接受更多的教育;那些受教育程度高的人更可能获得地位高的初职(他们的社会出身也可能起了很大作用);初职地位比较高的人更可能由此进入地位高的现职(他们所受的教育和社会出身可能继续发挥作用)。图16-2显示了父亲的职业地位通过各种“途径”传递给他们的儿子,这被称为“路径图”(path diagram)。路径最终可以由一组预测每种结果的方程表达。通过探索方程间的关系,我们可以判断联系两个变量的不同路径的相对重要性。此外,在某些情况下〔尤其是,如果某特定系数被固定(经常但不是必须)为0,或者两个或更多的系数被限定为相等——也就是说,如果模型被过度识别〕,我们可以评估模型的拟合优度。
1702650748
1702650749
1702650750
1702650751
1702650752 图16-2 Blau和Duncan关于分层过程的基本模型
1702650753
1702650754 资料来源:Blau和Duncan(1967:170)。
1702650755
1702650756 在刚才讨论的模型中,每个变量只有一种测量。然而,分析者经常可以获得被认为代表某个单一隐含或潜在概念的重复测量或一组测量。在这些情况下,我们可以使用SEM对测量误差进行评估和修正。两个早期但很有指导性的例子可见Bielby、Hauser和Featherman(1977)以及Hauser、Tsai和Sewell(1983)。SEM的另一种用法是估计包括互为因果的过程,甚至包括潜在变量。这样的例子可参考Duncan、Haller和Portes(1968)。(注意,刚才所引用文献的发表时间都比较早。这并不是因为缺少最近的研究——当前的相关文献非常多——而是早期研究在模型估计方面比后来结构方程模型被广泛使用之后的文献讲解得更加清楚。因此,出于教学目的,早期的文章更有帮助。)
1702650757
1702650758 OTIS DUDLEY DUNCAN(1921~2004),被他的朋友们称为Dudley,他从根本上改变了社会分层和社会流动研究,被统计学家和社会学家Leo Goodman称为“20世纪后半叶世界上最重要的量化社会学家”。Duncan是将路径分析(结构方程模型的一种形式)引入社会学的先驱。他将路径分析(path analysis)作为技术工具,把代际社会流动重新概念化为一个多级过程,其中地位属性(如受教育程度、职业地位和收入)被建模为不仅依赖父母的地位而且也依赖个人先前的地位。Duncan也对理解社会经济地位获得的种族差异、城市内空间和种族不平等以及在职业生涯后期对态度的测量等方面做出了重要贡献。
1702650759
1702650760 尽管缺乏高级数学训练,但Duncan可能在使用他能够运用的统计工具方面比任何其他社会学家都好。他有一种不同寻常的能力,既能事先想清楚问题,又非常清楚如何用统计模型来表达社会学思想。引人注目并值得说明的是,因为当时对如何使用当前人口调查数据的管理规则限制,在Duncan的里程碑式的著作《美国的职业结构》(American Occupational Structure)(Blau and Duncan,1967)中,尽管分析者还没能看到任何一个系数,但所有的表格和估计值都被事先给出了明确界定。有趣的是,Duncan自己认为他的晚期著作《社会测量笔记》(Notes on Social Measurement,1984)是他最重要的贡献,但这并没有得到许多受他巨大贡献强烈影响的研究者的广泛认同。
1702650761
1702650762 Duncan出生在德克萨斯州的Nocona,进入大学前的大多数时间都是在俄克拉荷马州的Stillwater度过。他父亲Otis Durant Duncan也是一位社会学家,在俄克拉荷马州立大学任教授。Duncan在路易斯安那州立大学完成本科学业,在明尼苏达大学获得硕士学位,“二战”期间在美国部队服役三年,于1949年在芝加哥大学完成博士学业。他曾在宾夕法尼亚州立大学、威斯康星大学、芝加哥大学、密歇根大学、亚利桑那大学和加州大学圣巴巴拉分校任教。Duncan还擅长为电子音乐作曲,因此在不知道他是一位杰出的社会科学家的人群中,他还是一位非常知名的电子音乐作曲家。
1702650763
1702650764 估计SEM的策略是充分利用假设的(观测到的和潜在的)变量之间的关系所隐含的特定协方差结构(即在观测变量的方差和协方差之间的一组关系),这也是此技术有时被称为协方差结构模型(covariance structure modeling)的原因。我们可以通过比较模型隐含的协方差结构和从分析数据观测到的协方差结构来评估拟合优度。
1702650765
1702650766 结构方程模型历史悠久,且发展历程多样。这个模型始于1918年种群基因学家Sewall Wright创建的路径分析。它由Otis Dudley Duncan引入社会学(和其他社会科学)〔见Duncan(1975)的早期介绍〕;认识到Wright著作价值的人可能是Robert W.Hodge,当时他是Duncan在芝加哥大学时的一名学生。在同一时期,经济学家开始更多地使用联立方程模型。仔细研究这里引用的例子就可看出,即使有路径图帮助展示系统中的假设关系,结构方程模型的识别和估计也是一个冗长且易犯错误的过程。随着特别为估计协方差结构模型设计的计算机软件的引入,情况发生了变化。第一个此类软件包由Jöreskog(1970)设计,被称为LISREL〔线性结构关系(Linear Structural Relations)的缩写〕。后来的软件包括Bentler和Wu的EQS,Arbuckle的AMOS,Muthén和Muthén的MPlus。许多较新的软件包使分析者很容易画出路径图,然后由软件转化成一个方程系统,并估计系数。可以上网搜索这些软件的最新版本及其他软件包,包括针对一般目的统计软件包的模块。
1702650767
1702650768 SEWALL WRIGHT(1889~1988)因1918年创建路径分析而被社会科学家所知。但实际上这只是与他的研究不太相关的成就,是从他作为一位种群遗传学家的研究成果中派生出来的。他出生在马萨诸塞州的Melrose;在Lombard College获得本科学位,主修数学专业,他父亲当时在那里教书。后来,他在哈佛大学获得生物学博士学位。他早期在美国农业部工作,1925年开始在芝加哥大学动物学系工作,直到1955年退休,之后他前往威斯康星大学麦迪逊分校。在威斯康星他继续做研究和发表成果。他最后一篇文章(第211篇)发表于1988年,就在他因摔伤而去世的前几天,享年99岁。
1702650769
1702650770 Wright对科学的主要贡献是与R.A.Fisher和J.B.S.Haldane一起创立了理论种群遗传学。Fisher、Wright和Haldane的研究是关于基因变异“现代进化综合论”发展的重要一步。Wright也对哺乳动物遗传学和生化遗传学做出了重要贡献。
1702650771
1702650772 James Steiger是一位心理学家,对结构方程模型做出了重要贡献。他在2001年发表的文章中对结构方程模型的这些发展提出了些许质疑的观点,认为新近的估计SEM方法的简单化导致人们在应用中(尤其是在心理学中)忽略了模型所隐含的假设及其局限性——最重要的是,结构方程模型并不能魔术般地解决“相关并不意味着因果关系”这一简单问题。在一定程度上,它是一种能让分析者探索基于先验理论设定模型的含义的方法。因此,结构方程模型被看作是最好的一种解释方法,其另一个特征则是在某些情况下可以判定某一特殊模型是否与观测数据一致。如果这样正确地加以使用,SEM会是一个有价值的工具。〔尽管Bollen在1989年为社会科学家编写的教材有一定难度,但它仍然是结构方程模型的最好的入门书。有关技术方面的问题也可见Bollen和Long(1993)编写的文集;Bollen和Curran在2006年的书中,用SEM估计潜在曲线模型(latent curve models);Bollen和Brand在2008年的文章中用SEM估计随机和固定效应模型。〕
1702650773
1702650774
1702650775
1702650776
1702650777 量化数据分析:通过社会研究检验想法 [:1702644844]
1702650778 量化数据分析:通过社会研究检验想法 概率抽样的重要性
1702650779
[ 上一页 ]  [ :1.70265073e+09 ]  [ 下一页 ]