1702648640
1702648641
效应比例测度法
1702648642
1702648643
当有一个自变量与因变量呈非线性关系时,会出现一个特殊的测度问题。在第7章中,我们讨论过检验非线性关系,以及通过变换模型的函数形式来表达非线性关系的方法。之前我们介绍过一种表达非线性关系的可能方法,即将变量转变为一系列的分类,并研究分类变量与结果变量之间的关系。在这一节我将介绍一种分类变量的扩展方法——效应比例测度法,在因变量具有明确的计量时可以使用〔使用效应比例测度法研究的例子,参见Treiman和Terrell(1975)〕。
1702648644
1702648645
例如,假设我们想研究在某一具有多种教育系统的国家,其教育获得和职业地位之间的关系。我们预测在这种系统下,职业获得不仅与受教育程度相关,而且与其所受教育的类型相关。在这种情况下,如何用简洁的方法显示教育的作用成为一个难题。我们当然可以用受教育程度和所受教育的类型来共同创建一个类型变量,但这可能引入许多系数。另一种方法可能更好,用各种类型的教育对职业地位的影响来构建教育测度。从技术角度讲这很简单。我们先来估计职业地位〔用国际职业的社会经济指标测量(International Socioeconomic Index of Occupations,ISEI)(Ganzeboom,de Graaf,and Treiman,1992;Ganzeboom and Treiman,1996)〕和一系列上述类型的变量所对应的虚拟变量之间的关系,然后我们构建一个新的受教育程度变量,其中类型变量的每一组都由其预测的职业地位值替代。
1702648646
1702648647
这样做的结果是使教育获得与职业地位之间的相关最大化——任何其他的教育测度都不可能产生更高的相关(在使用同一分类的情况下),当然,这里所说的相关就是相关比率(correlation ratio)。因而受教育程度变量应被解释为“以平均职业地位回报为参照的最高教育获得”。只要分析者能对读者清晰地说明这一操作过程,就不会存在疑义。该方法的优点是:它允许教育获得被简单地包括在随后的分析中。因而我们可以评估教育获得与职业地位之间的关系如何受到其他因素的影响,以及该相关在不同人群之间的差别,例如性别或种族差异。
1702648648
1702648649
这里有一个构建和使用此类测度的例子(该例没有提供下载文件,因为其中不涉及新的计算方法)。在前面分析的1996年中国调查中(第6、7和9章;数据详情和下载信息参见附录A),受教育程度是按表11-6中的类别请受访者回答的。虽然除了最后两项,该分类好像是按升序排列的序次测度,但这并不说明该测度与职业地位的单调关系。事实上,其关系并不是单调的,这一点从表11-6显示的ISEI均值就可以看出来。例如,职业高中、中专、中技的毕业生倾向于比没有上大学的正常高中毕业生获得明显较高的职业地位。
1702648650
1702648651
表11-6 1996年中国20~69岁的男性按受教育程度的ISEI平均得分
1702648652
1702648653
1702648654
1702648655
1702648656
因此,我创建一个新的受教育程度变量,其中的每个类别被赋予表11-6中显示的ISEI平均得分。〔在Stata中,一个更方便的做法是用ISEI对受教育程度类别进行回归,并得到预测值。当然,该回归的R2值(0.372)正是我们在第5章得到的相关比率的平方η2。〕然后我们可以将此测度用于其他分析中。例如研究包括中国在内的几个国家中职业地位与教育和父亲职业的关系,评估国家间的异同,以及先赋因素和成就因素的相对重要性。
1702648657
1702648658
1702648659
1702648660
1702648662
量化数据分析:通过社会研究检验想法 含误差变量回归
1702648663
1702648664
前面我们已经注意到,不可靠的测量一般会导致较弱的估计效应。因此,当变量测量的信度不同时,多变量的关系结构常会被明显地曲解。因为态度变量的信度较低,因而包含这类变量的分析也常常具有误导性。当我们有关于信度测量指标的信息时,修正此问题的一种方法是对由低信度造成的相关性减弱进行修正。Stata命令-eivreg-(含误差变量回归)做这种运算很简便。分析者提供每个变量的信度估计,该命令则做出修正并进行回归估计(如果不提供信度估计,则该命令假设变量被完全准确地测量)。
1702648665
1702648666
为了展示该方法的操作过程及其结果,我提供一项对堕胎的态度和宗教信仰虔诚度对政治保守性影响的分析(使用前面构建的三个测度),并同时考虑种族、居住地和两者的交互作用,以及收入的自然对数。
1702648667
1702648668
从前面的分析中我们可以得到三个测度的信度指标。借用Jencks等(1979,表A2.13)的收入测量信度(0.8),并假设种族和居住地是无偏差测量的,则表11-7比较了没有进行修正的OLS估计结果,以及修正低信度影响的含误差变量估计结果。由于-eivreg-不允许对聚类效应进行标准误修正,并只能使用分析权重(aweight)〔或频数权重(fweight)〕,因而我用这些方法分别计算了传统回归和含误差变量回归。
1702648669
1702648670
修正不同信度产生了巨大的影响——宗教信仰虔诚度的系数提高了54%。此外,对治疗型堕胎的接受程度和收入对数的系数略微提高,而对个人偏好型堕胎的接受程度的系数则稍有下降。这些结果清楚地表明,如果变量的测量信度不同,则多元回归中各变量的相对效应是如何被歪曲的。(宗教信仰虔诚度、治疗型堕胎、收入和个人偏好型堕胎的测量信度分别为0.66、0.78、0.80和0.93。)
1702648671
1702648672
表11-7 用常规OLS回归和含误差变量回归估计的1984年美国成年人政治保守性影响因素模型的系数(N=1294)
1702648673
1702648674
1702648675
1702648676
1702648677
注意,除了一个特例外,所有系数都符合我们的假设:政治保守性随宗教信仰虔诚度的增强和收入的增加而增大,而对非黑人来说,政治保守性随在南方居住而增强(尽管最后的这一效应只是接近显著);而当对两种堕胎的接受程度都提高时,则政治保守性降低。意料之外的结果是,相比于对个人偏好型堕胎的接受程度,对治疗型堕胎的接受程度是政治保守性更强的预测变量。从前文的分析出发——受教育程度和宗教信仰虔诚度对接受个人偏好型堕胎的预测相比于对接受治疗型堕胎的预测好得多,我们会假设相反的结果。然而事实证明,在加入具有强解释力的宗教信仰虔诚度变量之后,个人偏好型堕胎的影响变得不显著了。
1702648678
1702648679
1702648680
1702648681
1702648683
量化数据分析:通过社会研究检验想法 本章小结
1702648684
1702648685
我们在本章看到多题项测度具有优势的原因:它们提高了测量信度。除了在前面各章中使用的简单计数法之外,我们介绍了两种构建测度的方法。在这一章,我们主要介绍以因子为基础的测度法,它能消除测度中那些不能反映其他题项所共同反映的潜在维度的题项,也能消除那些在反映了主要维度的同时还反映了其他维度的题项。我们还介绍了效应比例测度法,它能根据一系列类别针对某一标准变量的不同影响来构建测度。最后,我们介绍OLS回归的两种扩展:一是含误差变量回归,它能修正因低信度造成的回归系数衰减——当模型中的变量以不同信度测量时,该方法会修正我们的实质性结论;二是似不相关回归,它提供对具有不同因变量,但(至少部分)自变量相同的模型的比较方法。
1702648686
1702648687
1702648688
1702648689
[
上一页 ]
[ :1.70264864e+09 ]
[
下一页 ]