打字猴:1.702645143e+09
1702645143 完全理解这个例子是非常重要的,因为这个例子所呈现的计算百分比和比较百分比的逻辑适用于所有列联表。
1702645144
1702645145 控制变量
1702645146
1702645147 现在,我们已经知道了表现激进的概率随宗教信仰虔诚度的下降而上升。我们应该就此停止吗?如果到此为止,那就意味着我们要接受宗教是一个诱因的假设。也就是说,我们将得出的结论是:宗教可以让人们变得更不激进。假如我们有很强的理论支持:在任何情况下,宗教信仰虔诚度和激进之间都存在负相关,那么我们或许就可以认为我们做的双变量列联表是一种恰当的检验方法。但在一般情况下,我们会考虑是否存在其他的原因可以解释我们观察到的关系。例如,以现在的例子来看,我们或许会怀疑宗教信仰虔诚度和激进两者都由第三个因素决定。一种明显的可能性是教育。我们或许可以这样想:相比于所受教育较差的黑人来说,那些受过良好教育的黑人可能既不怎么信教,又更激进。如果是这样,那么即使宗教信仰虔诚度和激进之间没有因果联系,两者也会表现为负相关。这被称为虚假关联(spurious association)或虚假相关(spurious correlation)。
1702645148
1702645149 怎样检验这种可能性呢?
1702645150
1702645151 首先,我们需要通过构建表1-3来检验是否教育确实降低了宗教信仰虔诚度。从表中我们可以看到,1964年城市黑人中受过良好教育的人倾向于不信教。在只有小学受教育程度的人中,有31%的人非常虔诚,相比之下,高中或大学受教育程度的人中只有19%的人非常虔诚。进一步看,小学受教育程度的人中只有1%的人根本不信教,高中受教育程度的人中有4%的人根本不信教,大学受教育程度的人中有11%的人根本不信教。因此,我们能够说,受教育程度和宗教信仰虔诚度之间是反向或负向相关:随着受教育程度提高,宗教信仰虔诚度降低。(仔细研究这张表,想一想为什么是这样做百分比计算。如果你们换一个方向做百分数表,你们会得出什么结论?)
1702645152
1702645153 表1-3 1964年美国城市黑人按受教育程度划分的宗教信仰虔诚度的百分比分布
1702645154
1702645155
1702645156
1702645157
1702645158 表1-3的技术要点
1702645159
1702645160 (1)由于四舍五入取整引起的误差,表中百分比有时加总后不等于100%。偏差一个百分点是可以接受的(99~101)。较大的偏差可能是计算错误,要仔细检查。
1702645161
1702645162 (2)要注意标题表述的方法。标题讲述了这是什么表(百分比分布),包含哪些变量(习惯上先列出因变量),样本是什么(美国城市黑人),以及数据收集的时间(1964年)。一个表应该始终包含足够的信息,使读者不看文字也能读懂。因此,标题和变量名称应当清楚且完整;如果标题的空间不够,应当在脚注中对表加以说明。
1702645163
1702645164 (3)在解释百分比分布时,通常只比较两个极端的类别,而忽略中间类别。因此,之前我们指出“非常虔诚”的比例随受教育程度的提高而下降,而“根本不信教”的比例随受教育程度的提高而上升。关于中间类别(“有点虔诚”和“不怎么虔诚”)如何随受教育程度变化的相似结论是很难得出的,因为这些人有可能被归到邻近的类别中,从而导致得出不同的结论。例如,在大学受教育程度的人群中,如果“有点虔诚”或“根本不信教”的百分比较小,那么“不怎么虔诚”的百分比可能会较大。于是,如果将“不怎么虔诚”归为“有点虔诚”这一类别,则会得到大学受教育程度的人更易信教的结论;而如果将“不怎么虔诚”归为“根本不信教”这一类别,则会得到大学受教育程度的人不易信教的结论。因此,“不怎么虔诚”这一行不能单独解释,也就是说,通常我们不会根据表的中间行来做解释或得出结论。另一方面,把数据展示出来非常重要,以便读者知道你没有掩盖重要的细节,同时允许读者通过合并类别来重建表格(后面会谈到这一点)。
1702645165
1702645166 (4)在处理诸如宗教信仰虔诚度这类测度变量时,每个分布内百分比的相对大小没有什么意义。也就是说,相对大小的比较应该在自变量的不同类别之间进行,而不是在因变量的不同类别之间进行。在现在的例子中,正确的说法是:小学受教育程度的人比更高受教育程度的人更可能信教;而不正确的结论是:一半以上小学受教育程度的人为“有点虔诚”。这是因为变量的测度仅仅是序次测度,各类别没有一个绝对值。怎样才算是“非常虔诚”?我们所知道的是它比“有点虔诚”更虔诚。结果,我们可以简单地通过类别的组合来很容易地改变分布。举个例子,假如我们合并最上面的两行并称之为“虔诚”。在这种情况下,小学受教育程度的人中有88%的人是“虔诚”的。如果我们真的这样做,请思考这会如何改变我们针对此样本做出的结论。
1702645167
1702645168 其次,我们需要通过构建表1-4来判断受教育程度是否促进激进。
1702645169
1702645170 表1-4 1964年美国城市黑人按受教育程度划分的激进类别的百分比分布
1702645171
1702645172
1702645173
1702645174
1702645175 表1-4的技术要点
1702645176
1702645177 当你们用同样的数据做不同的表时,尽可能通过比较不同表中的数字来检查这些表的一致性。例如,表1-4中的样本数应该与表1-3中的一致。
1702645178
1702645179 从表1-4中我们看到,受教育程度越高,表现激进的百分比越大。小学受教育程度的人中仅有22%的人表现激进,高中受教育程度的人中有36%的人表现激进,而大学受教育程度的人中这一比例高达53%。换一种说法,即受教育程度和激进之间存在正相关关系:随着受教育程度提高,表现激进的概率也升高了。
1702645180
1702645181 因为相对于受教育较差的黑人,受过良好教育的城市黑人可以同时既更不信教又更激进,所以可能的情况是:①观察到的宗教信仰虔诚度和(非)激进之间的关系完全由它们相互依赖的受教育程度决定;②在受教育程度相同的人群中激进和宗教信仰虔诚度之间没有联系。如果这个证明是正确的话,我们会说受教育程度解释了宗教信仰虔诚度和激进之间的关系,并且这一关系是虚假的,因为它并不是由这两个变量之间存在因果关系导致的。
1702645182
1702645183 为了检验这种可能性,我们在各受教育程度类别内研究激进和宗教信仰虔诚度之间的关系。为了分析这种关系,我们构建一个激进类别的三维列联表,我们把激进类别按宗教信仰虔诚度划分,然后再按照受教育程度划分。这张表可以用两种不同的方式设置。第一种如表1-5,第二种如表1-6。
1702645184
1702645185 表1-5 1964年美国城市黑人按宗教信仰虔诚度和受教育程度划分的激进类别的百分比分布
1702645186
1702645187
1702645188
1702645189
1702645190 表1-5的技术要点
1702645191
1702645192 (1)在这类表中,受教育程度是控制变量。这样设置表是为了在各受教育程度类别内判断激进和宗教信仰虔诚度之间的关系,即“控制教育变量”,或“令教育变量为常数”,或“教育的净作用”(这三种表述的意思相同)。应当始终将控制变量放在交叉表的外面,以使它变化得最慢。这种形式便于读者读表,因为它把需要比较的数字放在相邻的列中。(我们有时想在控制两个自变量中的一个的情况下,研究另一个自变量与因变量之间的关系。在这些情况下,我们仍然会仅做一张表,并且以最容易读的形式做表。如果因变量是二分变量,或者可以被看作二分变量,我们就可以将表设置成表1-6的形式。)
[ 上一页 ]  [ :1.702645143e+09 ]  [ 下一页 ]