打字猴:1.702648661e+09
1702648661 量化数据分析:通过社会研究检验想法 [:1702644799]
1702648662 量化数据分析:通过社会研究检验想法 含误差变量回归
1702648663
1702648664 前面我们已经注意到,不可靠的测量一般会导致较弱的估计效应。因此,当变量测量的信度不同时,多变量的关系结构常会被明显地曲解。因为态度变量的信度较低,因而包含这类变量的分析也常常具有误导性。当我们有关于信度测量指标的信息时,修正此问题的一种方法是对由低信度造成的相关性减弱进行修正。Stata命令-eivreg-(含误差变量回归)做这种运算很简便。分析者提供每个变量的信度估计,该命令则做出修正并进行回归估计(如果不提供信度估计,则该命令假设变量被完全准确地测量)。
1702648665
1702648666 为了展示该方法的操作过程及其结果,我提供一项对堕胎的态度和宗教信仰虔诚度对政治保守性影响的分析(使用前面构建的三个测度),并同时考虑种族、居住地和两者的交互作用,以及收入的自然对数。
1702648667
1702648668 从前面的分析中我们可以得到三个测度的信度指标。借用Jencks等(1979,表A2.13)的收入测量信度(0.8),并假设种族和居住地是无偏差测量的,则表11-7比较了没有进行修正的OLS估计结果,以及修正低信度影响的含误差变量估计结果。由于-eivreg-不允许对聚类效应进行标准误修正,并只能使用分析权重(aweight)〔或频数权重(fweight)〕,因而我用这些方法分别计算了传统回归和含误差变量回归。
1702648669
1702648670 修正不同信度产生了巨大的影响——宗教信仰虔诚度的系数提高了54%。此外,对治疗型堕胎的接受程度和收入对数的系数略微提高,而对个人偏好型堕胎的接受程度的系数则稍有下降。这些结果清楚地表明,如果变量的测量信度不同,则多元回归中各变量的相对效应是如何被歪曲的。(宗教信仰虔诚度、治疗型堕胎、收入和个人偏好型堕胎的测量信度分别为0.66、0.78、0.80和0.93。)
1702648671
1702648672 表11-7 用常规OLS回归和含误差变量回归估计的1984年美国成年人政治保守性影响因素模型的系数(N=1294)
1702648673
1702648674
1702648675
1702648676
1702648677 注意,除了一个特例外,所有系数都符合我们的假设:政治保守性随宗教信仰虔诚度的增强和收入的增加而增大,而对非黑人来说,政治保守性随在南方居住而增强(尽管最后的这一效应只是接近显著);而当对两种堕胎的接受程度都提高时,则政治保守性降低。意料之外的结果是,相比于对个人偏好型堕胎的接受程度,对治疗型堕胎的接受程度是政治保守性更强的预测变量。从前文的分析出发——受教育程度和宗教信仰虔诚度对接受个人偏好型堕胎的预测相比于对接受治疗型堕胎的预测好得多,我们会假设相反的结果。然而事实证明,在加入具有强解释力的宗教信仰虔诚度变量之后,个人偏好型堕胎的影响变得不显著了。
1702648678
1702648679
1702648680
1702648681
1702648682 量化数据分析:通过社会研究检验想法 [:1702644800]
1702648683 量化数据分析:通过社会研究检验想法 本章小结
1702648684
1702648685 我们在本章看到多题项测度具有优势的原因:它们提高了测量信度。除了在前面各章中使用的简单计数法之外,我们介绍了两种构建测度的方法。在这一章,我们主要介绍以因子为基础的测度法,它能消除测度中那些不能反映其他题项所共同反映的潜在维度的题项,也能消除那些在反映了主要维度的同时还反映了其他维度的题项。我们还介绍了效应比例测度法,它能根据一系列类别针对某一标准变量的不同影响来构建测度。最后,我们介绍OLS回归的两种扩展:一是含误差变量回归,它能修正因低信度造成的回归系数衰减——当模型中的变量以不同信度测量时,该方法会修正我们的实质性结论;二是似不相关回归,它提供对具有不同因变量,但(至少部分)自变量相同的模型的比较方法。
1702648686
1702648687
1702648688
1702648689
1702648690 量化数据分析:通过社会研究检验想法 [:1702644801]
1702648691 量化数据分析:通过社会研究检验想法 第12章 对数线性分析
1702648692
1702648693 量化数据分析:通过社会研究检验想法 [:1702644802]
1702648694 本章内容
1702648695
1702648696 对数线性分析是对列联表中存在某些特定关系做推论的一项分析技术。本书前三章介绍了百分数表。在前三章中,我们花了很多时间介绍列联表,提出了一些经验法则来判断两个百分数的差异大到何种程度才给予关注,以及如何判断变量间的交互项,等等。对数线性分析为规范列联表分析提供了一种方法。它不仅可以评估从依据样本数据建立的列联表中观测到的关系是否有可能也存在于总体中,而且提供了一种描述这些关系的方法。我们在本章首先介绍如何用一个对数线性模型拟合多维表,以便于理解其原理。然后,我们用代际职业流动作为主要例子来介绍如何针对二维表建立更加简约的模型,当然,这些技术也可以用在很多其他领域。有关对数线性分析更详细的讲解可参考Knoke和Burke(1980),以及Powers和Xie(2000,Chap.4)。本章主要参考的是Powers和Xie(2000)。
1702648697
1702648698
1702648699
1702648700
1702648701 量化数据分析:通过社会研究检验想法 [:1702644803]
1702648702 量化数据分析:通过社会研究检验想法 引言
1702648703
1702648704 从某种意义上讲,拟合对数线性分析模型其实就是两个变量独立性的χ2〔称为卡方(chi-square)〕检验的一般化。回想一下常规的〔皮尔森(Pearson)〕χ2检验,每个单元格的观测频数是与一个完全独立模型相比较。在这个模型中,每个单元格的期望频数是边缘频数的简单乘积除以表中的样本总数。因此,观测频数相对于独立模型中期望频数的偏离程度决定了χ2值的大小。
1702648705
1702648706 这种方法可以被推广应用到更加复杂的关系中,但需要对公式做些改动。对于一个双变量频数分布,我们可以写出期望单元格频数的一般公式:
1702648707
1702648708 Fij=ητXiτYjτXYij      (12.1)
1702648709
1702648710 这里,η(读作“eta”)是单元格频数的几何均值(k个数值的几何均值是它们乘积的k次根);τXi(读作“tau”)是X变量第i个类别的“效应参数”(effect parameter);τYj是Y变量第j个类别的“效应参数”;τXYij是X变量第i个类别与Y变量第j个类别“交互项”的效应参数。
[ 上一页 ]  [ :1.702648661e+09 ]  [ 下一页 ]