打字猴:1.702650742e+09
1702650742
1702650743 目前,有大量文献讲解倾向分匹配统计理论和应用此方法的实践步骤。Smith发表于1997年的文章是很好的开始,并提供了有用的文献。Becker和Ichino(2002)、Abadie等(2004),以及Becker和Caliendo(2007)讨论了在Stata中如何使用倾向分匹配。Dehejia和Wahba(2002)、Brand和Halaby(2006)提供了有益的评估和具体例子。Harding(2003)提供了一种特别有指导性的应用。其他应用可见Berk和Newton(1985)、Stone等(1995)、Keating等(2001)、Lu等(2001)、Morgan(2001)、Black和Smith(2003)、Lundquist(2004),以及Cohen(2005)。倾向分匹配的一个缺陷是它不能平衡未被观测到的协变量。因此,如果你怀疑存在内生性问题,需要求助于这里讨论的方法之一,或在前一章中专门为解决此类问题设计的方法。
1702650744
1702650745 结构方程模型
1702650746
1702650747 结构方程模型(structural equation modeling,SEM)是可以对方程进行系统估计的一项技术(或准确地讲,一套技术),经常包含未被测量的或潜在的概念(latent constructs)。请看一个简单的例子,即如图16-2所示的Blau和Duncan(1967:170)关于地位获得的经典模型。当我们研究职业地位是如何从一代向下一代传递时,显然这是一个多级过程:父亲受到良好的教育并有地位高的工作,儿子也更可能接受更多的教育;那些受教育程度高的人更可能获得地位高的初职(他们的社会出身也可能起了很大作用);初职地位比较高的人更可能由此进入地位高的现职(他们所受的教育和社会出身可能继续发挥作用)。图16-2显示了父亲的职业地位通过各种“途径”传递给他们的儿子,这被称为“路径图”(path diagram)。路径最终可以由一组预测每种结果的方程表达。通过探索方程间的关系,我们可以判断联系两个变量的不同路径的相对重要性。此外,在某些情况下〔尤其是,如果某特定系数被固定(经常但不是必须)为0,或者两个或更多的系数被限定为相等——也就是说,如果模型被过度识别〕,我们可以评估模型的拟合优度。
1702650748
1702650749
1702650750
1702650751
1702650752 图16-2 Blau和Duncan关于分层过程的基本模型
1702650753
1702650754 资料来源:Blau和Duncan(1967:170)。
1702650755
1702650756 在刚才讨论的模型中,每个变量只有一种测量。然而,分析者经常可以获得被认为代表某个单一隐含或潜在概念的重复测量或一组测量。在这些情况下,我们可以使用SEM对测量误差进行评估和修正。两个早期但很有指导性的例子可见Bielby、Hauser和Featherman(1977)以及Hauser、Tsai和Sewell(1983)。SEM的另一种用法是估计包括互为因果的过程,甚至包括潜在变量。这样的例子可参考Duncan、Haller和Portes(1968)。(注意,刚才所引用文献的发表时间都比较早。这并不是因为缺少最近的研究——当前的相关文献非常多——而是早期研究在模型估计方面比后来结构方程模型被广泛使用之后的文献讲解得更加清楚。因此,出于教学目的,早期的文章更有帮助。)
1702650757
1702650758 OTIS DUDLEY DUNCAN(1921~2004),被他的朋友们称为Dudley,他从根本上改变了社会分层和社会流动研究,被统计学家和社会学家Leo Goodman称为“20世纪后半叶世界上最重要的量化社会学家”。Duncan是将路径分析(结构方程模型的一种形式)引入社会学的先驱。他将路径分析(path analysis)作为技术工具,把代际社会流动重新概念化为一个多级过程,其中地位属性(如受教育程度、职业地位和收入)被建模为不仅依赖父母的地位而且也依赖个人先前的地位。Duncan也对理解社会经济地位获得的种族差异、城市内空间和种族不平等以及在职业生涯后期对态度的测量等方面做出了重要贡献。
1702650759
1702650760 尽管缺乏高级数学训练,但Duncan可能在使用他能够运用的统计工具方面比任何其他社会学家都好。他有一种不同寻常的能力,既能事先想清楚问题,又非常清楚如何用统计模型来表达社会学思想。引人注目并值得说明的是,因为当时对如何使用当前人口调查数据的管理规则限制,在Duncan的里程碑式的著作《美国的职业结构》(American Occupational Structure)(Blau and Duncan,1967)中,尽管分析者还没能看到任何一个系数,但所有的表格和估计值都被事先给出了明确界定。有趣的是,Duncan自己认为他的晚期著作《社会测量笔记》(Notes on Social Measurement,1984)是他最重要的贡献,但这并没有得到许多受他巨大贡献强烈影响的研究者的广泛认同。
1702650761
1702650762 Duncan出生在德克萨斯州的Nocona,进入大学前的大多数时间都是在俄克拉荷马州的Stillwater度过。他父亲Otis Durant Duncan也是一位社会学家,在俄克拉荷马州立大学任教授。Duncan在路易斯安那州立大学完成本科学业,在明尼苏达大学获得硕士学位,“二战”期间在美国部队服役三年,于1949年在芝加哥大学完成博士学业。他曾在宾夕法尼亚州立大学、威斯康星大学、芝加哥大学、密歇根大学、亚利桑那大学和加州大学圣巴巴拉分校任教。Duncan还擅长为电子音乐作曲,因此在不知道他是一位杰出的社会科学家的人群中,他还是一位非常知名的电子音乐作曲家。
1702650763
1702650764 估计SEM的策略是充分利用假设的(观测到的和潜在的)变量之间的关系所隐含的特定协方差结构(即在观测变量的方差和协方差之间的一组关系),这也是此技术有时被称为协方差结构模型(covariance structure modeling)的原因。我们可以通过比较模型隐含的协方差结构和从分析数据观测到的协方差结构来评估拟合优度。
1702650765
1702650766 结构方程模型历史悠久,且发展历程多样。这个模型始于1918年种群基因学家Sewall Wright创建的路径分析。它由Otis Dudley Duncan引入社会学(和其他社会科学)〔见Duncan(1975)的早期介绍〕;认识到Wright著作价值的人可能是Robert W.Hodge,当时他是Duncan在芝加哥大学时的一名学生。在同一时期,经济学家开始更多地使用联立方程模型。仔细研究这里引用的例子就可看出,即使有路径图帮助展示系统中的假设关系,结构方程模型的识别和估计也是一个冗长且易犯错误的过程。随着特别为估计协方差结构模型设计的计算机软件的引入,情况发生了变化。第一个此类软件包由Jöreskog(1970)设计,被称为LISREL〔线性结构关系(Linear Structural Relations)的缩写〕。后来的软件包括Bentler和Wu的EQS,Arbuckle的AMOS,Muthén和Muthén的MPlus。许多较新的软件包使分析者很容易画出路径图,然后由软件转化成一个方程系统,并估计系数。可以上网搜索这些软件的最新版本及其他软件包,包括针对一般目的统计软件包的模块。
1702650767
1702650768 SEWALL WRIGHT(1889~1988)因1918年创建路径分析而被社会科学家所知。但实际上这只是与他的研究不太相关的成就,是从他作为一位种群遗传学家的研究成果中派生出来的。他出生在马萨诸塞州的Melrose;在Lombard College获得本科学位,主修数学专业,他父亲当时在那里教书。后来,他在哈佛大学获得生物学博士学位。他早期在美国农业部工作,1925年开始在芝加哥大学动物学系工作,直到1955年退休,之后他前往威斯康星大学麦迪逊分校。在威斯康星他继续做研究和发表成果。他最后一篇文章(第211篇)发表于1988年,就在他因摔伤而去世的前几天,享年99岁。
1702650769
1702650770 Wright对科学的主要贡献是与R.A.Fisher和J.B.S.Haldane一起创立了理论种群遗传学。Fisher、Wright和Haldane的研究是关于基因变异“现代进化综合论”发展的重要一步。Wright也对哺乳动物遗传学和生化遗传学做出了重要贡献。
1702650771
1702650772 James Steiger是一位心理学家,对结构方程模型做出了重要贡献。他在2001年发表的文章中对结构方程模型的这些发展提出了些许质疑的观点,认为新近的估计SEM方法的简单化导致人们在应用中(尤其是在心理学中)忽略了模型所隐含的假设及其局限性——最重要的是,结构方程模型并不能魔术般地解决“相关并不意味着因果关系”这一简单问题。在一定程度上,它是一种能让分析者探索基于先验理论设定模型的含义的方法。因此,结构方程模型被看作是最好的一种解释方法,其另一个特征则是在某些情况下可以判定某一特殊模型是否与观测数据一致。如果这样正确地加以使用,SEM会是一个有价值的工具。〔尽管Bollen在1989年为社会科学家编写的教材有一定难度,但它仍然是结构方程模型的最好的入门书。有关技术方面的问题也可见Bollen和Long(1993)编写的文集;Bollen和Curran在2006年的书中,用SEM估计潜在曲线模型(latent curve models);Bollen和Brand在2008年的文章中用SEM估计随机和固定效应模型。〕
1702650773
1702650774
1702650775
1702650776
1702650777 量化数据分析:通过社会研究检验想法 [:1702644844]
1702650778 量化数据分析:通过社会研究检验想法 概率抽样的重要性
1702650779
1702650780 从样本推论总体——无论是否承认,它几乎总是社会科学家感兴趣的事情——从研究总体中抽取样本,必须知道总体中每个个体入样的概率。只有在这种情况下,统计推论的原则才适用。
1702650781
1702650782 尽管如此,许多研究依然违背此原则,抽取“方便的”或“随意的”样本。以此观点来看,中国社会调查是特别糟糕的,他们经常抽取一些省份或城市,却说它们代表了特定类型的地方;事实确实如此,即使是诸如中国健康和营养调查(Chinese Health and Nutrition Survey,CHNS)这类高质量的调查(Henderson et al.,1994)。这种做法的问题是没有办法知道没有被选择的地点在多大程度上和以什么方式确实与所选地点相似,且能被所选地点代表。总之,“有代表性的”地点样本不能代替概率样本。通常在抽样以及实地调查中,为设计一个能推论到研究总体的样本付出额外代价是非常值得的。
1702650783
1702650784 请一位外国人来设计调查 社会科学家在描述他们自己社会的特征方面非常糟糕。下面举一个恰当的例子:我在1996年中国调查的过程中,受到当地政府的反对,在某个县级城市街区无法进行实地调查。我的中国同事随意替换同一城市的另一个街区,他们说这个街区与调查受阻的街区非常相似,而不是让我从同一层中提供一个替代的地方(回顾第9章的介绍,基于人口的受教育程度我们有25个城镇分层)。但是,其结果是替代的街区属于第23层,而调查受阻的街区是在第18层,显然,这违背了分层抽样设计。
1702650785
1702650786 事实是,如果你希望掌握某一社会清晰、明确的特征,应该请一位外国人提出方案。Carnegie Corporation充分认识到这一关键点,他们委托瑞典经济学家和社会学家Gunnar Myrdal指导20世纪30年代美国的一项种族关系研究,其结果是产生了一部经典专著——《美国的困境》(An American Dilemma)(Myrdal,1944:vi-vii)。
1702650787
1702650788 超总体
1702650789
1702650790 然而,我们有时候希望把结论推论到抽样的总体之外,例如单次截面调查。尽管调查是在某一年进行的,但分析者通常想推论到那一年之外。再次援引1996年的中国调查,我的目标是将研究结论推论到“20世纪末期的中国人口”而不是“1996年夏天的中国人口”。通常情况下,这类结论是暗含的,直到一位评论家指出过去真实的现在已不再真实,这才成为问题。对评论家的回应常常采取这种偶尔明确但通常含糊其辞的方式,即援引“人种志意义上的现状”,认为正在描述的是1996年的中国社会“以及所有具有同样环境的社会”。也就是说,借用超总体(superpopulation)概念——被抽样的总体能代表类似总体在概念上的超总体。
1702650791
[ 上一页 ]  [ :1.702650742e+09 ]  [ 下一页 ]