打字猴:1.702648449e+09
1702648449
1702648450 这里,是真实得分之间的相关,rXY是X与Y之间的观测相关,和分别是X和Y的信度系数。方程11.1也可看作是对不可信所引起的衰减的修正公式。是修正衰减后X和Y之间的相关。例如,如果两个测度的信度都是0.7,且它们之间的观测相关是0.3,那么修正衰减后的相关将会是。显然,相关性受到变量信度的强烈影响。
1702648451
1702648452 评估信度的方法 有几种测量测度信度的方法:
1702648453
1702648454 ·重测信度(test-retest reliability)是一个测度在两个不同时点上分值的相关性。
1702648455
1702648456 ·复本信度(alternate-forms reliability)是测量具有同样潜在维度的两个不同测度之间的相关性。
1702648457
1702648458 ·内在一致性信度(internal-consistency reliability)是一个测度的多个题项之间的相关函数。下面将讨论的克朗巴哈α信度系数(Cronbach’s alpha)就是一种内在一致性测量。
1702648459
1702648460 分析者有时候也会在着手进行多元回归分析之前对衰减相关进行修正,然后依据修正过的相关系数矩阵估计回归模型〔此类相关被广泛使用的例子见Jencks等(1972,1979)〕。当然,这只在分析者知道或能够估计信度系数的时候才有可能。Stata命令-eivreg-(含误差变量回归)提供了一种在回归估计中使用变量信度信息的简便方法。本章后面的一个具体例子阐述了此概念。
1702648461
1702648462 通常,测度的内在一致性信度取决于两个因素:题项数量和题项间的平均相关性。每个部分的增加都会使信度得到提升。有几种内在一致性信度测量,其中克朗巴哈α信度系数的应用最广:
1702648463
1702648464
1702648465
1702648466
1702648467
1702648468 这里,N是题项数量,是题项间的平均相关性。在表11-1中,我们能够看出题项间的平均相关分别为0.09、0.25和0.49(它们对应于平均因子负荷0.3、0.5和0.7)时对测度信度所带来的影响。
1702648469
1702648470 表11-1 不同题项数量组合下多题项测度的克朗巴哈α信度系数与题项间的平均相关性
1702648471
1702648472
1702648473
1702648474
1702648475 显然,即使题项间具有0.25这样低的平均相关,包含至少7或8个题项的测度也可能产生合理可信的结果。尽管如此,切记“合理可信的”并不等同于“高度可信的”是非常重要的。态度预测通常不令人信服的一个原因是,涉及态度测度的相关性因为信度问题而大大减弱了,尤其是测度中仅包括少数几个题项时。
1702648476
1702648477 为什么SAT和GRE考试包括几百个题项 一个测度中的题项数量对信度的影响清楚地说明,为什么诸如SAT和GRE之类的考试会包含几百个题项。因为大学或研究生院的招生和经济资助明显地受到考试成绩的影响,我们期望考试是非常可信的。如果同样的学生在两个月或三个月之后再参加一次考试(期间没有为考试做过准备),原则上这个考试会产生同样的学生排名。有趣的是,即使有几百道题,一个人在不同时候的SAT或GRE成绩经常差异极大,这大概是因为考试成绩受到诸如考试期间紧张和疲劳程度(当然还有准备程度)的影响。
1702648478
1702648479
1702648480
1702648481
1702648482 量化数据分析:通过社会研究检验想法 [:1702644798]
1702648483 量化数据分析:通过社会研究检验想法 测度构建
1702648484
1702648485 我们在本章介绍创建多题项测度的三种策略:加总测度法、以因子为基础的测度法和效应比例测度法。〔对于测度的简要的一般性介绍,见McIver和Carmines(1981)。对于最近的一些扩展,见Netemeyer、Beardon和Sharma(2003)。经典的但仍然很有用的介绍见Nunnally和Bernstein(1984)。〕
1702648486
1702648487 加总测度法
1702648488
1702648489 构建多题项测度的最简单的方法是将每个构成题项的得分简单相加或取平均值——这正是我们目前所做的。在题项是二分变量时,相当于计算肯定应答的数量。当题项本身就构成测度时——如连续型变量(受教育年限或收入),或者在“强烈支持”到“强烈反对”范围内变化的态度题项——我们通常在取平均值之前将变量标准化(减去均值并除以标准差)。如果不这样做,则具有最大方差的题项在最终的测度中会具有最大的权重。考虑下面的例子会很容易理解方差对权重的影响:如果研究者决定通过结合受教育年限和收入来构建一个社会经济地位(SES)测度,具体方法是直接将每位受访者的受教育年限和年收入相加。他或许认为这样做能得到一个SES测度,但他得到的其实只是一个略带“噪音”的收入测度,因为受教育年限的取值一般在0~20年(在美国,事实上是8~20年),而收入的取值范围是数万美元。通过将每个变量除以其标准差,分析者在确定总测度分值时赋予每个变量相同的权重。(我第一次意识到这一点还是很多年前在研究生院的时候,当时一位教授告诉我,他和另一位教授有效地决定着谁通过和谁不通过博士生资格考试——尽管考试是由许多教授一起来打分的。他们的做法很简单,就是用足一百分的测度来打分,但他们的大多数同事给不及格试卷只打50分或之类的分数。)
1702648490
1702648491 上面描述的这类简单加总测度的缺点是,所含题项可能或不能反映某个单一的潜在维度。一个带有异质性题项的测度有可能是无效的和不可信的。之所以无效是因为除分析者想让测度测量的东西之外,它还测量了其他东西。之所以不可信是因为至少某些题项之间是弱相关甚至负相关。
1702648492
1702648493 以因子为基础的测度法
1702648494
1702648495 我们如何确定想纳入某一测度中的题项反映的是单一维度呢?先来识别一组我们认为是测量了某个单一潜在概念的候选题项。然后,我们凭经验审查两个问题:①所有题项作为一个整体“相互矛盾”吗?或者即使我们认为它们反映了同样的概念范畴,是否有一个或多个题项与其余的题项(在弱相关性意义上而言)存在经验性差异?如果存在,我们必须拒绝会引起麻烦的题项。②每个题项与因变量是否近似地具有同样的净关系?如果没有,就不能使用有偏离的题项,因为这再次证明它们测量的不是同一个概念(或者除了我们感兴趣的概念外,它们还测量了其他概念)。评估第二个问题很简单,只需将因变量对一组选取的实验性题项以及额外的、合适的控制变量做回归。当测度被用作因变量时,应该检验与自变量相关的各个题项的回归系数。在这两种情况下,我们所要寻找的证据是,所有备选题项具有相同的符号且大小近似同等。
1702648496
1702648497 受教育年限、职业地位和收入是很好的例子,它们正相关但对各类因变量具有非常不同的净影响。例如,生育率被认为在控制了收入后与受教育年限呈负相关,但在控制了受教育年限后与收入呈正相关。类似地,容忍度的各种测量趋向于在控制了收入后与受教育年限呈正相关,但在控制了受教育年限后与收入不相关或负相关。因此,应当避免构建社会经济地位测度的习惯性做法,每个成分变量应该作为因变量的一个单独预测变量被纳入进来。
1702648498
[ 上一页 ]  [ :1.702648449e+09 ]  [ 下一页 ]