打字猴:1.70264535e+09
1702645350 此表之所以是相加的,是因为将每个变量的影响加到一起会产生最终的结果。样本中任何个人接受堕胎的概率至少为0.3(所以我们可以将0.3加到表中的每个单元格);信奉新教的人接受合法堕胎的概率比信奉天主教的人大0.1(因此,所有新教的单元格加0.1);高中未毕业的人接受堕胎的概率比高中以下的人高0.05(相应地,高中未毕业的单元格加0.05);高中毕业的人接受堕胎的概率比高中以下的人高0.15(因此,高中毕业的单元格加0.15);受教育程度为大学及以上的人接受堕胎的概率比高中以下的人高0.35(因此,受教育程度为大学及以上的单位格加0.35)。这样就得到表2-2的结果(将每个数值乘以100可以将比例转换成百分数)。
1702645351
1702645352 相比较而言,当变量之间存在交互效应时,表中每个变量的效应是不可能相加的,因为每个变量的效应依赖于其他某个自变量或一组自变量的值。
1702645353
1702645354 社会科学家感兴趣的许多关系都包含交互效应——特别是与性别、种族有关的一些效应,但实际上也存在一些可以相加的关系。现在尚无足够的理论能让我们很好地识别所研究的关系中哪些是相加的,哪些包含交互效应。
1702645355
1702645356 本书后面的章节将会介绍一些复杂的方法来区别交互效应和相加效应,并介绍如何通过对数线性分析和回归分析来处理各种交互效应。
1702645357
1702645358
1702645359
1702645360
1702645361 量化数据分析:通过社会研究检验想法 [:1702644728]
1702645362 量化数据分析:通过社会研究检验想法 直接标准化
1702645363
1702645364 我们经常希望估计在控制了其他变量后两个变量之间的关系。虽然我们已经知道如何估计偏相关(即一个或几个控制变量的各类别中两个变量之间的关系),但如果能在剔除或控制其他变量的影响后,再构建一张表示两个变量之间平均关系强度的表也非常有用。直接标准化,也可称为协变修正(covariate adjustment),就提供了这样一种方法。然而,因为此技术被广泛应用于人口学中,所以我使用该方法在人口学中常用的名称——直接标准化。需要注意的是,即使都称为标准化,直接标准化方法与标准化变量度量方法也是完全没有关系的。第5章将介绍如何对变量建立统一度量标准。
1702645365
1702645366 实例1:美国城市黑人中分激进类别与宗教信仰虔诚度的关系
1702645367
1702645368 一般情况下,通过具体事例来解释操作过程是最容易的,因此,让我们再次回顾第1章中表1-2至表1-6的分析(略有调整)。我们之前感兴趣的是,美国黑人的激进和宗教信仰虔诚度之间的关系是否被受教育程度所解释,即受教育程度较高的黑人更倾向于不信宗教且更激进。因为受教育程度不能完全解释激进和宗教信仰虔诚度之间的关系,所以要是有一种方法能表示在剔除了受教育程度的影响之后两者之间的关系将非常有用。为了达到这个目的,我们可以调整每一宗教信仰虔诚度类别中表现激进的百分比。具体来讲,用样本中受教育程度的总频数分布做权重,计算在每一宗教信仰虔诚度类别中表现激进的百分比的加权平均值。〔另一种方法和此方法在数学上完全一致,但先计算加权和(sum),之后用这个加权和作为每一类别的样本比例(proportion)的权重。〕通过这些计算,我们可以构建一张表,这张表显示了当所有的宗教信仰群体具有同样的教育分布时宗教信仰虔诚度和激进之间的关系。从这个角度来看,我们可以说这张表显示了在控制了受教育程度的影响后宗教信仰虔诚度与激进之间的关系。像前面提到的,此过程被称为直接标准化或协变修正。
1702645369
1702645370 需要注意的是,我们并不一定要用表的总分布作为权重,也可以用其他任何权重。例如,如果我们假设黑人具有和白人一样的教育分布,并在此基础上估计宗教信仰虔诚度和激进之间的关系,此时我们将白人视为标准人口(standard population),并用白人的教育分布(从其他数据来源得到)作为权重。下面我们将介绍采用这种策略的两个例子。
1702645371
1702645372 现在我们构建一张表来描述在调整了受教育程度或对其进行标准化后的宗教信仰虔诚度和激进之间的关系,以熟悉整个步骤。我们从表1-6的数据开始。首先,我们根据受教育程度的总体分布来得到标准分布。因为表中有993(=108+…+49)个样本,353(=108+201+44)人具有小学受教育程度,所以具有小学受教育程度的比例是0.356(=353/993)。类似地,具有高中受教育程度的比例是0.508,具有大学受教育程度的比例是0.137。这就是我们要用的权重。接着我们计算在调整后(或标准化)的非常虔诚的人群中表现激进的百分比。我们把“非常虔诚”这个人群继续划分为三组不同受教育程度的人,然后对这三组不同受教育程度表现激进的人的百分比进行加权求和(即表中第一行的数值),得到:17%×0.356+34%×0.508+38%×0.137=29%。为了标准化“有点虔诚”这一类中表现激进的人的百分比,我们对表中第二行的百分比使用同样的权重,得到22%×0.356+32%×0.508+48%×0.137=31%。最后,为了标准化“不怎么虔诚或根本不信教”类别中表现激进的人的百分比,对表中第三行使用同样的方法,其结果为45%。然后,我们比较标准化前后的百分比——标准化前的百分比,即宗教信仰虔诚度和激进之间零级相关(即没有控制受教育程度变量)时相应的百分比,结果如表2-3所示。〔计算这些结果的Stata-do-文件、命令-dstdize-和显示结果的-log-文件可以从出版商Jossey-Bass/Wiley的网站(www.josseybass.com/go/quantitativedataanalysis)下载。本章其余的例子也可以从这个网站下载到类似文件。因为我们还没有开始介绍相关的计算,所以读者现在只需要先了解这些资料的来源,在后面再学习这些计算方法——除非你们已经很熟悉Stata了。〕
1702645373
1702645374 Stata-do-文件和-log-文件 在Stata中,-do-文件记录命令,-log-文件记录-do-文件执行的结果。正如在后面第4章中你们将看到的那样,数据分析的管理是复杂的,而创建-do-文件将有助于管理数据分析。-do-文件不仅可以提高工作效率,而且可以永久保存生成的每张表或每个回归系数的计算过程。如果任何人想要重复几年前或几个月前执行的分析,他们就会体会到精确记录每个结果的计算过程是非常有价值的。
1702645375
1702645376 当数据被表示为表格形式时,比较在控制和没有控制其他变量的情况下自变量在不同类别间的百分比(如表现激进的比例)变化范围是很有用的。我们可以从表2-3看出,不怎么虔诚或根本不信教与非常虔诚这两组人中表现激进的比例之差是21个百分点;当控制了受教育程度之后,这个差值减少为16个百分点,降低了24%(=1-16/21)。从某种意义上来讲,我们可以说受教育程度大概“解释”了宗教信仰虔诚度和激进之间关系的1/4。我们在做此类计算的时候需要特别小心,只有当这些计算有助于使分析更明了时才使用。例如,如果宗教信仰虔诚度和激进之间的关系不是单调的(monotonic)(也就是说,如果表现激进的比例不随宗教信仰虔诚度的降低而增加或至少不降低),计算百分比的“变化范围”或“距离”就没有多大意义。
1702645377
1702645378 表2-3 将1964年美国城市黑人受教育程度标准化前后分宗教信仰虔诚度表现激进比例的比较(N=993)
1702645379
1702645380
1702645381
1702645382
1702645383 在早期调查研究中的直接标准化 尽管直接标准化是人口学分析的传统技术,但在早期调查研究文献中它也被用来得到“加权净百分比差异”或“加权净百分比变化范围”。只有当计算调整的或标准化的比率时此方法才真正有用。百分比差异或百分比变化范围的计算只有当作为控制变量效应加总的一种方法时才有用。
1702645384
1702645385 实例2:对人类是从动物进化来的观点的认同(用2个或更多控制变量的直接标准化)
1702645386
1702645387 我们有时想通过多个控制变量一次性调整或标准化我们的数据,以期得到在控制两个或更多其他变量时一个变量对另一个变量的效应的结果。下面以对进化论这一科学观点的接受程度为例来具体介绍。全国民意研究中心(NORC)主持的综合社会调查(General Social Survey,GSS)在1993、1994和2000年都问了同一个问题:
1702645388
1702645389 对下面的每一个陈述,在方框中选择与您的观点最接近的选项。在您看来,下面这个观点有多正确?……人类起源于早期的动物种群。
1702645390
1702645391 表2-4显示了将三年调查数据合并后应答项的分布。因为各年的数据之间没有实质性的差别,因此我将这三年的数据合并成一个数据集以增大样本量。评估各年份数据之间变异的方法将在第7章讨论。关于GSS的介绍和如何获得GSS数据的细节可以参考附录A。用来创建此样本的Stata-do-文件和-log-文件可以从前面提到的出版商的网站下载。一般来说,每个例子的-do-和-log-文件都可以从网上下载。
1702645392
1702645393 表2-4 美国成年人对进化论这一科学观点持不同态度的百分比分布(1993、1994和2000年)
1702645394
1702645395
1702645396
1702645397
1702645398 对我来讲,表2-4的结果非常令人震惊。美国绝大部分成年人怎么会不接受在科学界毫无争议的观点呢?这也许是因为近年来越来越多的人坚持宗教原教旨主义的观点,尤其是新教原教旨主义的观点——宣称《圣经》是完全正确的。为了判断这是否正确,表2-5呈现了分教派——将新教区分为“原教旨主义”和“宗派主义”——的对进化论这一科学观点的接受程度(通过赞同人类是从其他动物进化来的观点是“完全正确”的来测量)。(因缺乏更多的信息,我根据样本中成员相信“《圣经》是逐字逐句记录下来的上帝的原话”的比例将新教简单地分为两类。宗派主义者中至少有50%的人选择此项,“其他类”的新教徒和除了“美国浸礼会教友”教友与“无教派的浸礼会教友”的所有其他浸礼会教友都被编为原教旨主义者。所有其他新教徒都被编为新教宗派主义者。)不幸的是,由于没有将GSS的原编码数据进行具体区分,所以我们无法根据是否逐字逐句地相信他们的教义的信息对非新教信徒做同样的区分。
1702645399
[ 上一页 ]  [ :1.70264535e+09 ]  [ 下一页 ]