打字猴:1.70264844e+09
1702648440 创建可信测度的一个重要原因是,在其他条件都相同的情况下,不可信测度与其他变量的相关性会较低。这源于不可信测度包含大量的“噪音”。我们可以将测度看作具有一个“真值”成分和一个“误差”成分。“真值”成分由观察测量与真实潜在维度的相关表示;此相关的大小说明了测度的信度。“误差”成分——与潜在维度不相关的部分——反映了观察测量的特殊决定因素。从此信度的定义出发,它意味着两次测量中任何一个的信度越低,它们观测值之间的相关性相对于潜在维度之间的真实相关性而言就越低。从形式上,只要知道观测值之间的相关和每个变量的信度,我们就能够估计变量之间的“真实”相关。真实相关由下面的方程给出:
1702648441
1702648442
1702648443
1702648444
1702648445
1702648446
1702648447
1702648448
1702648449
1702648450 这里,是真实得分之间的相关,rXY是X与Y之间的观测相关,和分别是X和Y的信度系数。方程11.1也可看作是对不可信所引起的衰减的修正公式。是修正衰减后X和Y之间的相关。例如,如果两个测度的信度都是0.7,且它们之间的观测相关是0.3,那么修正衰减后的相关将会是。显然,相关性受到变量信度的强烈影响。
1702648451
1702648452 评估信度的方法 有几种测量测度信度的方法:
1702648453
1702648454 ·重测信度(test-retest reliability)是一个测度在两个不同时点上分值的相关性。
1702648455
1702648456 ·复本信度(alternate-forms reliability)是测量具有同样潜在维度的两个不同测度之间的相关性。
1702648457
1702648458 ·内在一致性信度(internal-consistency reliability)是一个测度的多个题项之间的相关函数。下面将讨论的克朗巴哈α信度系数(Cronbach’s alpha)就是一种内在一致性测量。
1702648459
1702648460 分析者有时候也会在着手进行多元回归分析之前对衰减相关进行修正,然后依据修正过的相关系数矩阵估计回归模型〔此类相关被广泛使用的例子见Jencks等(1972,1979)〕。当然,这只在分析者知道或能够估计信度系数的时候才有可能。Stata命令-eivreg-(含误差变量回归)提供了一种在回归估计中使用变量信度信息的简便方法。本章后面的一个具体例子阐述了此概念。
1702648461
1702648462 通常,测度的内在一致性信度取决于两个因素:题项数量和题项间的平均相关性。每个部分的增加都会使信度得到提升。有几种内在一致性信度测量,其中克朗巴哈α信度系数的应用最广:
1702648463
1702648464
1702648465
1702648466
1702648467
1702648468 这里,N是题项数量,是题项间的平均相关性。在表11-1中,我们能够看出题项间的平均相关分别为0.09、0.25和0.49(它们对应于平均因子负荷0.3、0.5和0.7)时对测度信度所带来的影响。
1702648469
1702648470 表11-1 不同题项数量组合下多题项测度的克朗巴哈α信度系数与题项间的平均相关性
1702648471
1702648472
1702648473
1702648474
1702648475 显然,即使题项间具有0.25这样低的平均相关,包含至少7或8个题项的测度也可能产生合理可信的结果。尽管如此,切记“合理可信的”并不等同于“高度可信的”是非常重要的。态度预测通常不令人信服的一个原因是,涉及态度测度的相关性因为信度问题而大大减弱了,尤其是测度中仅包括少数几个题项时。
1702648476
1702648477 为什么SAT和GRE考试包括几百个题项 一个测度中的题项数量对信度的影响清楚地说明,为什么诸如SAT和GRE之类的考试会包含几百个题项。因为大学或研究生院的招生和经济资助明显地受到考试成绩的影响,我们期望考试是非常可信的。如果同样的学生在两个月或三个月之后再参加一次考试(期间没有为考试做过准备),原则上这个考试会产生同样的学生排名。有趣的是,即使有几百道题,一个人在不同时候的SAT或GRE成绩经常差异极大,这大概是因为考试成绩受到诸如考试期间紧张和疲劳程度(当然还有准备程度)的影响。
1702648478
1702648479
1702648480
1702648481
1702648482 量化数据分析:通过社会研究检验想法 [:1702644798]
1702648483 量化数据分析:通过社会研究检验想法 测度构建
1702648484
1702648485 我们在本章介绍创建多题项测度的三种策略:加总测度法、以因子为基础的测度法和效应比例测度法。〔对于测度的简要的一般性介绍,见McIver和Carmines(1981)。对于最近的一些扩展,见Netemeyer、Beardon和Sharma(2003)。经典的但仍然很有用的介绍见Nunnally和Bernstein(1984)。〕
1702648486
1702648487 加总测度法
1702648488
1702648489 构建多题项测度的最简单的方法是将每个构成题项的得分简单相加或取平均值——这正是我们目前所做的。在题项是二分变量时,相当于计算肯定应答的数量。当题项本身就构成测度时——如连续型变量(受教育年限或收入),或者在“强烈支持”到“强烈反对”范围内变化的态度题项——我们通常在取平均值之前将变量标准化(减去均值并除以标准差)。如果不这样做,则具有最大方差的题项在最终的测度中会具有最大的权重。考虑下面的例子会很容易理解方差对权重的影响:如果研究者决定通过结合受教育年限和收入来构建一个社会经济地位(SES)测度,具体方法是直接将每位受访者的受教育年限和年收入相加。他或许认为这样做能得到一个SES测度,但他得到的其实只是一个略带“噪音”的收入测度,因为受教育年限的取值一般在0~20年(在美国,事实上是8~20年),而收入的取值范围是数万美元。通过将每个变量除以其标准差,分析者在确定总测度分值时赋予每个变量相同的权重。(我第一次意识到这一点还是很多年前在研究生院的时候,当时一位教授告诉我,他和另一位教授有效地决定着谁通过和谁不通过博士生资格考试——尽管考试是由许多教授一起来打分的。他们的做法很简单,就是用足一百分的测度来打分,但他们的大多数同事给不及格试卷只打50分或之类的分数。)
[ 上一页 ]  [ :1.70264844e+09 ]  [ 下一页 ]