1702650764
估计SEM的策略是充分利用假设的(观测到的和潜在的)变量之间的关系所隐含的特定协方差结构(即在观测变量的方差和协方差之间的一组关系),这也是此技术有时被称为协方差结构模型(covariance structure modeling)的原因。我们可以通过比较模型隐含的协方差结构和从分析数据观测到的协方差结构来评估拟合优度。
1702650765
1702650766
结构方程模型历史悠久,且发展历程多样。这个模型始于1918年种群基因学家Sewall Wright创建的路径分析。它由Otis Dudley Duncan引入社会学(和其他社会科学)〔见Duncan(1975)的早期介绍〕;认识到Wright著作价值的人可能是Robert W.Hodge,当时他是Duncan在芝加哥大学时的一名学生。在同一时期,经济学家开始更多地使用联立方程模型。仔细研究这里引用的例子就可看出,即使有路径图帮助展示系统中的假设关系,结构方程模型的识别和估计也是一个冗长且易犯错误的过程。随着特别为估计协方差结构模型设计的计算机软件的引入,情况发生了变化。第一个此类软件包由Jöreskog(1970)设计,被称为LISREL〔线性结构关系(Linear Structural Relations)的缩写〕。后来的软件包括Bentler和Wu的EQS,Arbuckle的AMOS,Muthén和Muthén的MPlus。许多较新的软件包使分析者很容易画出路径图,然后由软件转化成一个方程系统,并估计系数。可以上网搜索这些软件的最新版本及其他软件包,包括针对一般目的统计软件包的模块。
1702650767
1702650768
SEWALL WRIGHT(1889~1988)因1918年创建路径分析而被社会科学家所知。但实际上这只是与他的研究不太相关的成就,是从他作为一位种群遗传学家的研究成果中派生出来的。他出生在马萨诸塞州的Melrose;在Lombard College获得本科学位,主修数学专业,他父亲当时在那里教书。后来,他在哈佛大学获得生物学博士学位。他早期在美国农业部工作,1925年开始在芝加哥大学动物学系工作,直到1955年退休,之后他前往威斯康星大学麦迪逊分校。在威斯康星他继续做研究和发表成果。他最后一篇文章(第211篇)发表于1988年,就在他因摔伤而去世的前几天,享年99岁。
1702650769
1702650770
Wright对科学的主要贡献是与R.A.Fisher和J.B.S.Haldane一起创立了理论种群遗传学。Fisher、Wright和Haldane的研究是关于基因变异“现代进化综合论”发展的重要一步。Wright也对哺乳动物遗传学和生化遗传学做出了重要贡献。
1702650771
1702650772
James Steiger是一位心理学家,对结构方程模型做出了重要贡献。他在2001年发表的文章中对结构方程模型的这些发展提出了些许质疑的观点,认为新近的估计SEM方法的简单化导致人们在应用中(尤其是在心理学中)忽略了模型所隐含的假设及其局限性——最重要的是,结构方程模型并不能魔术般地解决“相关并不意味着因果关系”这一简单问题。在一定程度上,它是一种能让分析者探索基于先验理论设定模型的含义的方法。因此,结构方程模型被看作是最好的一种解释方法,其另一个特征则是在某些情况下可以判定某一特殊模型是否与观测数据一致。如果这样正确地加以使用,SEM会是一个有价值的工具。〔尽管Bollen在1989年为社会科学家编写的教材有一定难度,但它仍然是结构方程模型的最好的入门书。有关技术方面的问题也可见Bollen和Long(1993)编写的文集;Bollen和Curran在2006年的书中,用SEM估计潜在曲线模型(latent curve models);Bollen和Brand在2008年的文章中用SEM估计随机和固定效应模型。〕
1702650773
1702650774
1702650775
1702650776
1702650778
量化数据分析:通过社会研究检验想法 概率抽样的重要性
1702650779
1702650780
从样本推论总体——无论是否承认,它几乎总是社会科学家感兴趣的事情——从研究总体中抽取样本,必须知道总体中每个个体入样的概率。只有在这种情况下,统计推论的原则才适用。
1702650781
1702650782
尽管如此,许多研究依然违背此原则,抽取“方便的”或“随意的”样本。以此观点来看,中国社会调查是特别糟糕的,他们经常抽取一些省份或城市,却说它们代表了特定类型的地方;事实确实如此,即使是诸如中国健康和营养调查(Chinese Health and Nutrition Survey,CHNS)这类高质量的调查(Henderson et al.,1994)。这种做法的问题是没有办法知道没有被选择的地点在多大程度上和以什么方式确实与所选地点相似,且能被所选地点代表。总之,“有代表性的”地点样本不能代替概率样本。通常在抽样以及实地调查中,为设计一个能推论到研究总体的样本付出额外代价是非常值得的。
1702650783
1702650784
请一位外国人来设计调查 社会科学家在描述他们自己社会的特征方面非常糟糕。下面举一个恰当的例子:我在1996年中国调查的过程中,受到当地政府的反对,在某个县级城市街区无法进行实地调查。我的中国同事随意替换同一城市的另一个街区,他们说这个街区与调查受阻的街区非常相似,而不是让我从同一层中提供一个替代的地方(回顾第9章的介绍,基于人口的受教育程度我们有25个城镇分层)。但是,其结果是替代的街区属于第23层,而调查受阻的街区是在第18层,显然,这违背了分层抽样设计。
1702650785
1702650786
事实是,如果你希望掌握某一社会清晰、明确的特征,应该请一位外国人提出方案。Carnegie Corporation充分认识到这一关键点,他们委托瑞典经济学家和社会学家Gunnar Myrdal指导20世纪30年代美国的一项种族关系研究,其结果是产生了一部经典专著——《美国的困境》(An American Dilemma)(Myrdal,1944:vi-vii)。
1702650787
1702650788
超总体
1702650789
1702650790
然而,我们有时候希望把结论推论到抽样的总体之外,例如单次截面调查。尽管调查是在某一年进行的,但分析者通常想推论到那一年之外。再次援引1996年的中国调查,我的目标是将研究结论推论到“20世纪末期的中国人口”而不是“1996年夏天的中国人口”。通常情况下,这类结论是暗含的,直到一位评论家指出过去真实的现在已不再真实,这才成为问题。对评论家的回应常常采取这种偶尔明确但通常含糊其辞的方式,即援引“人种志意义上的现状”,认为正在描述的是1996年的中国社会“以及所有具有同样环境的社会”。也就是说,借用超总体(superpopulation)概念——被抽样的总体能代表类似总体在概念上的超总体。
1702650791
1702650792
另一个例子是一些被人类学家研究的社会,这些数据由Murdock及其同事们汇编而成〔如Murdock和Provost(1973)〕。因为不是所有小而孤立的社会都已经被人类学家们研究过,Murdock收集的数据不可能是这类社会的一个概率样本。尽管如此,此数据集的使用者仍然视之为各种社会的一个概率样本,其假设是:这些被19世纪和20世纪的人类学家们研究过的社会是所有这类社会超总体的代表。
1702650793
1702650794
GEORGE PETER MURDOCK(1897~1985)是一位人类学家,他反对美国人类学界普遍采用的研究方法,而提倡通过量化的、不同社会间的比较来检验不同假设并建立关于社会组织和人类行为的一般规则。他出生在康涅狄格州的一个第5代农场主家庭,在耶鲁获得美国历史学学士学位后,开始在哈佛法学院学习。他在第二年退出法学院,之后环球旅行了很长时间。旅行激发了他对人类学的兴趣。他未能被当时人类学系最具影响力的哥伦比亚大学录取,于是进入耶鲁大学,继续受Sumner进化思想的影响(这种思想与哥伦比亚Boas的社会特殊论针锋相对,后者后来成为人类学的主流)。他于1925年在耶鲁获得博士学位,并留在那里任教,度过大部分的职业生涯。1938年Murdock发表了他的第一篇比较研究文章,大约在同一时间他开始做一个项目——收集所有已知人类社会的数据。十年后〔“二战”时在海军服役后,他和学生写了一本关于密克罗尼西亚文化的《人种手册》(Ethnographic Handbooks),这是他们走出哥伦比亚大学的办公室工作取得的成绩〕,他认为如果资料能被广泛使用,那么他的数据收集将会更加有价值。他说服社会科学研究理事会(Social Sciences Research Council)资助他建立一个跨大学的组织,后来被称为人类关系地区档案(Human Relations Area Files,HRAF),这促进了大家使用他所收集的资料。1950年Murdock到匹兹堡大学工作,在那里创办了《人种学》(Ethnology)杂志,并继续比较数据的收集和研究。
1702650795
1702650796
在以机构为基础的研究中可以发现另一个例子——例如,关于医院、诊所和它们服务区的研究,经常被用在公共卫生研究中。对这种做法的辩解为,被研究的特定医院或诊所可以代表所有类似地点的情况,但它们仅仅可被认为是方便样本。
1702650797
1702650798
何时能够合理地援引超总体概念?当存在总体的数据并可以从中抽取概率样本时,我认为方便样本是很不好的替代,而且不符合当前的科学标准——尽管存在诸如研究生没有经费、没有时间之类的搪塞之词。但是,当不了解总体和总体不可知时,像Murdock和Provost的人种学样本的情况,运用已知数据并一般化到某一超总体是合理的。在基于调查时点某一总体的概率样本的单一截面调查的情况下,把所描述的社会特征看作是调查时点的社会特征时,结论是安全的,但当我们试图推论到其他时点时,就会越来越不可靠。尽管也可以这么做,但必须说明其合理性。
1702650799
1702650800
汇合多次调查数据 当超总体概念可以被合理地援引时,它就有相当多的实际用途。一项极富吸引力的应用是在可以获得随时间变化的可比较数据的时候,像美国的综合社会调查(GSS)及其他重复截面调查。如果可以证实研究所关注的变量之间的关系不随时间变化,那么就可以合并来自不同年份的数据以增大可用于分析的样本规模。当任何一年都没有足够的数据支持可靠的比较时——如对美国种族差异的研究,这是一个非常有用的策略。基本的检验方法是本章前面和第6章讨论的组间比较策略的一个变异(也可见第7章对趋势分析的讨论)。这可以分为两步。首先,估计下面形式的方程:
1702650801
1702650802
1702650803
1702650804
1702650805
这里,Xi是预测变量,Tj用于表示各截面调查(省略第一次调查是为了避免线性依赖)。其次,检验cj和dij是否共同为0。如果是,你可以得出所有样本来自一个单独总体的结论,并可以放心地汇合数据。但是,即使在Y的层次(cj之间有显著差异)或者在一个或多个X与Y的关系(dij之间有显著差异)方面存在随时间发生的变化,你也仍然希望汇合数据,但在研究社会过程时应该纳入虚拟变量和交互项以反映其随时间变化的方式。这样做的优点是可以同时分析关系随时间发生的变化并提升在评估那些不随时间变化的关系时的统计鉴定力。〔一些最近使用此策略的例子,见Barkan和Greenwood(2003)、Chen和Guilkey(2003)、Powers(2003)、Fitzgerald和Ribar(2004)、Kelly和Kelly(2005),及Tavits(2005)。〕
1702650806
1702650807
使用重复截面调查的另一种方法也值得推崇,即使用某一调查数据发展一个较佳的模型,用从数据中观测到的而不是理论预期的关系来修正模型。然后,再用另一个重复截面数据来检验该较佳的模型是否依然合适,例如,就GSS来讲,我们可以用在该年之前或之后进行的调查来检验模型(回想第7章关于此方法的讨论)。
1702650808
1702650809
最后一种可能性是,当家庭户中有多人的信息被收集(或者访谈多个家庭户成员,或者请一位受访者告知其他家庭户成员的特征)时,我们通过将有信息的每个人看作是一个单独个案来扩展样本。但是,在这种情况下,有必要解决观测值不相互独立的问题,可以用调查估计方法对家庭户内的聚集进行修正,或采用前面提到的由Mason(2001)提出的多层线性模型方法。此外,当只有受限的子样本的信息能够获得时,例如只有配偶的信息,有必要对后果给予特别关注——例如,应该对已婚人群样本和全部成人样本产生的结果差异进行敏感性分析(见下一节对敏感性分析的讨论)。
1702650810
1702650811
1702650812
1702650813
[
上一页 ]
[ :1.702650764e+09 ]
[
下一页 ]