1702645210
抛开理论和逻辑关系上的考虑(如果一个变量理论上相关,就该加进任何解释变量吗?),在一个列联表中限制变量数量的一个直接的技术原因是我们很快就会发现没有足够的样本数了。大多数抽样调查都包含几百甚至几千个样本。我们已经看到,一个三维变量的列联表就需要我们把宗教信仰虔诚度的两个类别进行合并。用同一个数据生成一个四维变量的列联表可能产生更多百分比过小的分布,这样会导致结果非常不可信。由于列联表研究三维以上的变量存在困难,这促使我们寻找一些回归分析的替代形式。本书后面的很多内容将会致力于详细讲解基于回归的各种方法。
1702645211
1702645212
表1-5通过比较三组中每组的相应列,让我们在控制了宗教信仰虔诚度变量之后能估计受教育程度变量对激进的影响。因此,我们会注意到,在那些非常虔诚的人中,小学受教育程度的人中有17%的人是激进的,相比较而言,高中受教育程度的人中有34%的人是激进的,大学受教育程度的人中有38%的人是激进的;在那些有点虔诚的人中,相应的比例分别为22%、32%和48%;在那些不怎么虔诚或根本不信教的人中,相应的比例分别为32%、47%和68%。因此,我们得出结论,无论宗教信仰虔诚度如何,所受教育越好越激进。
1702645213
1702645214
但这种比较的方法非常繁琐,因为需要在整张表中到处寻找合适的单元格。当因变量是二分变量的时候,即只有两个应答分类时,我们可以把表做得更简洁和引人注目。表1-6包含了与表1-5完全一样的信息,但更加简洁。像表1-6这类表被称为三维表。
1702645215
1702645216
表1-6 1964年美国城市黑人按宗教信仰虔诚度和受教育程度划分的激进的百分比分布(三维形式)
1702645217
1702645218
1702645219
1702645220
1702645221
表1-6的技术要点
1702645222
1702645223
每对数字给出了具有某类特征人群的百分比和计算这个百分比的基数或分母。所以,表中左上角的数字表明,在非常虔诚且是小学受教育程度的108人中,有17%的人是激进的。我们用这张表可以重建前面五张表中的任何一张(不怎么虔诚或根本不信教这两类被合并为一类),当然存在一定的四舍五入误差。你可以尝试做一做,以确保你理解了这些表之间的关系。
1702645224
1702645225
比较表1-5和表1-6,你们会看到它们准确地包含了同样的信息——表1-5中所有附加的数字都是多余的。重要的是,表1-6更容易懂,因为我们只要简单地顺着列向下读,就可以看到在保持受教育程度不变的条件下,宗教信仰虔诚度对激进的影响;而只需简单地按行来读,就可以看到在保持宗教信仰虔诚度不变的条件下,受教育程度对激进的影响。
1702645226
1702645227
1702645228
1702645229
1702645231
量化数据分析:通过社会研究检验想法 本章小结
1702645232
1702645233
我们在本章中已经知道如何将一个初始的想法变成一个研究问题,如何选择合适的抽样方法,如何执行一项调查,如何创建一系列变量并组合成反映研究者所研究问题概念的测量指标。我们接着介绍了怎样构建反映两个变量之间关系的百分数表,特别强调了使用条件概率分布(分别按照自变量的每一类别计算的各因变量类别的概率分布)的概念来确定百分数表的方向问题。这是本章最难的概念,你们应该确保彻底理解了这个概念。
1702645234
1702645235
另一个需要完全理解的重要概念是统计控制的思想,也被称为控制混淆变量或保持混淆变量不变,它是用来确定某种关系是否存在于控制变量各类别内的概念。最后,我们介绍了各种构建和展示表格的技术问题,这是为了构建出新颖易读的表格。
1702645236
1702645237
我们将在下一章继续讨论列联表、涉及两个以上变量的各种分析方法以及更常见的多元分析的逻辑。
1702645238
1702645239
1702645240
1702645241
1702645243
量化数据分析:通过社会研究检验想法 第2章 列联表中的变量关系
1702645244
1702645246
本章内容
1702645247
1702645248
本章将从应用上和技术上增进我们对列联表分析的理解。第一,我们会继续探讨分析的逻辑,即在分析中继续引入更多的变量;第二,我们介绍一种被称为抑制效应(suppressor effect)的特殊情况,即当两个自变量的影响相互抵消的情况;第三,我们介绍变量如何联合产生特殊效应,即如何区分相加效应(additive effects)和交互效应(interaction effects);第四,我们将介绍如何通过直接标准化的方法(direct standardization)来估计在多元百分数表中在控制其他自变量后一个变量的影响;第五,我们介绍实验(experiments)和统计控制(statistical controls)之间的区别。
1702645249
1702645250
1702645251
1702645252
1702645254
量化数据分析:通过社会研究检验想法 分析的逻辑
1702645255
1702645256
在调查研究方法的传统做法中(如Lazarsfeld,1955;Zeisel,1985),我们习惯上把第三个变量完全或部分地解释了两个变量之间的相关关系区分成两种情况:虚假(spurious)相关和能够被一个干预(intervening)变量或一组干预变量解释的相关。这两者的区别在于,当一个控制变量(Z)从时间上或因果关系上发生在另一个自变量(X)和因变量(Y)之前,并且控制变量完全或部分地解释了自变量和因变量之间的相关关系时,我们推论在自变量和因变量之间不存在因果关系或仅存在弱的因果关系。然而,当控制变量在时间上或因果关系上处于自变量和因变量之间时,我们就不能够声称自变量和因变量之间不存在因果关系;相反,这种情况表示,此干预变量解释了或有助于解释自变量如何对因变量产生影响。我们在前一章中介绍了虚假相关,在本章中,我们将继续介绍虚假相关,同时介绍干预变量的影响。
1702645257
1702645258
PAUL LAZARSFELD(1901~1976)是推动调查研究成为美国社会学界数据收集主要方法的奠基人——可能也是最杰出的人物。Paul Lazarsfeld出生在维也纳,获得数学博士学位(论文是有关数学视角下的爱因斯坦万有引力理论)。他涉足社会学是因为1926年与Marie Jahoda结婚,并同她(和Hans Zeisel)一起参与到日后成为经典的Marienthal研究中(见本章后面Zeisel的简历)。虽然他与Jahoda的婚姻没能天长地久,但是他对社会科学的兴趣却终其一生。1933年他来到美国,在Newark大学(现在是Rutgers大学的一部分)找到第一份工作,随后在哥伦比亚大学建立了应用社会研究部。这个应用社会研究部不仅培养了许多杰出的社会科学家,而且还成为量化数据收集和分析方法的创新基地。Lazarsfeld标志性的理念之一是,使社会研究最有效的方法是发挥集体智慧,即各方面的专家一起合作。但是,也许最重要的是,他一贯认为解决实际问题是社会学界的根本任务,且回答此类问题能促进学科的理论发展。
1702645259
[
上一页 ]
[ :1.70264521e+09 ]
[
下一页 ]