1702645050
1702645051
犹太教 3
1702645052
1702645053
其他 4
1702645054
1702645055
不信教 5
1702645056
1702645057
未答 9
1702645058
1702645059
注意,在这些回答中没有顺序——没有哪个回答比任何其他的回答“较好”或者“更高”。这类变量简单地提供了一种将人分成不同宗教群体的方法。同时还要注意的是,调查中的每个人都有一个编码,即使那些没有回答问题的人——由“其他”和“未答”来表示。一个恰当的变量设计要求分类一定要相互排斥并要穷尽,也就是说,在样本中的每一个人有且仅有一个编码(我们将在第4章讨论缺失数据编码的各种方法)。
1702645060
1702645061
序次变量有一个额外的特征:它们可以按照一定的维度——数量、价值或水平——进行排序。上面关于民权示威游行的问题就是序次变量的一个例子:对应答进行排序的维度是对黑人的帮助程度。实际上,这是我们在调查中经常碰到的一个有用的例子。其中的两个回答——“不知道”和明确的“未答”——显然不能像其他应答那样排序。在这些情况下,研究者有两个选择:要么从分析中删除这些应答,要么重新对它们进行编码,即改变编码使之表示新的顺序。一种可行的方法是将“不知道”放在“有一点儿帮助”和“有一点儿伤害”之间,因为“不知道”本质上是中立的,而不是正面的或者负面的回答。此时,分析人员应该将变量重新编码,将“不知道”赋值为“3”、“有一点儿伤害”赋值为“4”、“伤害很大”赋值为“5”。是否这样做取决于研究问题的具体需要。非常重要的一点是,这些操作在执行之前要预先告知读者,并在分析报告中予以详述。但是,将“未答”视为中性回答未免有些牵强,因为没有应答的情况千差万别,包括简单错误、没有完成问卷等。由于无法预测未应答者本来会如何应答这些“未答”的问题,因此,更明智的做法或许是将“未答”作为缺失数据来处理。
1702645062
1702645063
序次变量的重要特征是不包含类别间的间距信息。例如,我们不知道民权示威游行“有一点儿伤害”的判断与“有一点儿帮助”的判断之间的差异是否大于或小于“有一点儿帮助”与“有很大帮助”之间的差异。因此,一些统计学家和社会科学研究者认为应该用序数统计方法(ordinal statistics)来分析序次变量,因为序数统计方法对变量类别之间的间距没有做任何假设,仅仅利用了序次的性质。不过,这个问题并不是本书要讨论的内容。在本书中,我们主要介绍两类统计方法:一类适用于名义变量;另一类适用于间距和比率变量,后者被称为参数统计方法。我们没有特别为序次变量设计专门的统计方法(第14章介绍的序次逻辑斯蒂回归除外),主要有以下几点理由。首先,参数统计方法不仅比序数统计方法强大得多,而且更容易在数学上进行处理。更重要的是,结果非常稳健,也就是说,一般情况下,它们对那些违反了数据属性假设的情况非常不敏感,例如误差服从正态分布。其次,序数统计方法的应用范围远远比参数统计方法窄,而且同样的问题有许多可供选择的方法,而研究者对使用哪类序数统计方法却难以达成一致意见。再次,许多序数统计方法暗含一些假设,这些假设正如参数统计方法中的潜在假设一样,为序数统计方法增加了许多限制。例如,当间距或比率变量转换为序次变量时,可以证明斯皮尔曼等级序数相关(Spearman’s rank order correlation,一种序数统计方法)与皮尔森积矩相关〔product-moment(Pearson)correlation,一种常规的参数相关系数〕是一致的。实际上,斯皮尔曼等级序数相关并不是对类别之间的距离不做假设,而是假设每两个类别之间是等距的。总之,使用序数统计方法反而会得不偿失。然而,如果你们对这类统计方法感兴趣,可以参看Davis(1971)和Hildebrand等(1977)在文献中的讨论。
1702645064
1702645065
间距变量与比率变量类似,因为这两种变量类别之间的间距是有意义的。我们不仅(从某些维度)可以说某一类别高于另一类别,而且可以指出高出多少。这类变量理所当然地适用各种标准数学运算——加法、减法、乘法和除法。因此,我们能够计算出它们的平均值和标准差等统计量。两者的差别在于比率变量有一个内在零点,而间距变量则没有。因此,比率变量能够通过把某一个受访者(或某一组受访者)的值与另一个受访者或另一组受访者的值相除来比较,但间距变量只能通过类别之间的差来比较。间距变量的例子如智商、职业声望等,比率变量的例子如受教育年限、年收入等。如果说某人的智商比其他人高两倍是没有意义的,但我们可以说某人的智商比其他人高10点,或者说智商在种族内的方差大于种族间的方差。相比较而言,我们可以说男女的平均年收入相差10000美元,也可以说男性的平均收入是女性的两倍。
1702645066
1702645067
在本书中,我们经常将序次变量视为间距变量来处理,以便能使用前面提到的参数统计方法。但是,我们也会介绍如何评估间距假设是否恰当的方法,以及在允许同时处理名义变量、间距变量或比率变量的一般参数方法的范畴内,将变量看作名义变量来使用的方法。这些方法涉及回归分析的各种形式。
1702645068
1702645069
通常情况下,一个研究涉及的概念不能用单个题项完全表达。例如,在Marx的问卷中,没有单个题项能够完全表达他所定义的“激进”概念。因此,他构建了一个多题项测度(scale)来表达这个概念。具体地讲,他用了与1964年情况相关的8个题项来构建这个“激进”测度。如果一个受访者在下面8个题项中至少在6个题项上给出激进的回答(见括号内),那么这个人就被归为“激进分子”(Marx,1967b:41)。
1702645070
1702645071
在您看来,华盛顿政府推进种族融合的措施太慢、太快,还是刚好?(太慢)
1702645072
1702645073
黑人通过努力工作获得成功的难易程度和其他人一样吗?(不同意)
1702645074
1702645075
黑人应该花更多的时间祈祷,花更少的时间游行示威。(不同意)
1702645076
1702645077
实话说,我害怕加入民权示威游行。(不同意)
1702645078
1702645079
您希望看到更多的民权示威游行还是较少的民权示威游行?(更多)
1702645080
1702645081
如果一个餐厅的老板不想让黑人在他店里吃饭,他就可以将他们拒之门外。(不同意)
1702645082
1702645083
在黑人被赋予平等权利之前,他们必须证明他们值得如此对待。(不同意)
1702645084
1702645085
如果一位物主不想把东西卖给黑人,他就可以不卖。(不同意)
1702645086
1702645087
多题项测度具有很多优点,特别是其信度(reliability)和效度(validity)(定义见第11章)都较高。我们可以通过许多方法——其中有些方法明显比另一些方法好——来构建多题项测度,但在构建过程中要避免一些易犯的严重错误。在后面的第11章,我们会主要介绍测度的构建和评估。
1702645088
1702645089
在任何量化分析中,第三个要素是模型(model),这是我们通过组织和处理数据来检验想法或假设的方法。模型包括两部分:统计方法的选择,以及针对分析中变量之间如何相关而提出的假设。基于这两个部分,我们能够估计变量之间关系的相对大小或强弱程度,进而通过判断对不同效果大小的估计是否与假设一致来检验假设(或想法,或理论)。举一个前面介绍过的简单例子,我们的模型是按宗教信仰虔诚度和激进类别划分的列联表(相继引入控制变量,稍后讨论此问题),我们的期望(假设)是不信教者中“激进分子”的比例要比信教者中的比例高;或者是备择假设:不信教者中“激进分子”的比例低。我们在本书后面的章节中会介绍更复杂的统计模型——通常是一般线性模型的变体,但是基本逻辑不会变。如何进行具体的列联表分析是下一节的主要内容。
1702645090
1702645091
SAMUAL A.STOUFFER(1900~1960)是一位对调查研究的发展做出贡献的先驱。他出生在爱荷华州的萨克城(Sac City),从Morningside学院获得学士学位,获得哈佛大学文学硕士学位,在他父亲创办的报纸——《萨克城太阳报》做了3年编辑,然后在芝加哥大学开始他社会学研究生的学习生涯,1930年获得博士学位。在芝加哥期间,他在William F.Ogburn的指导下开始学习统计学,尽管他自己说起初对这门学科很反感。他在芝加哥集中学习了统计方法和数学,然后在伦敦大学做了一年的社会科学研究理事会研究员(Social Science Research Council Fellow)。在众多学者中他主要与Karl Pearson一起工作(见第5章Pearson的传记概略)。Stouffer在威斯康星大学、芝加哥大学和哈佛大学的统计学系与社会学系都担任过教职。他还是能力很强的研究管理者,主持了大量旨在从科学角度解释主要社会危机的大项目:在20世纪30年代,他主持了一个社会科学研究理事会项目来评估大萧条对社会秩序的影响,出版了13本著作。在第二次世界大战期间,他主持了一项对国防部军人的研究,出版了一本经典著作——《美国军人》(The American Soldier)(Stouffer et al.,1949)。在20世纪50年代,他还主持了一项反映麦卡锡时期(McCarthy era)反对共产主义高峰期的研究,这项研究由福特基金会资助,最终出版了《共产主义、服从和人权自由》(Communism,Conformity,and Civil Liberties,1955)。不幸的是,他意外地死于一场突发性疾病,去世时年仅60岁,当时他正在为人口理事会开展一项新的关于发展中国家生育率影响因素的研究。他在为联邦政府开发统计程序方面也扮演了重要的角色,他帮助建立了美国预算局统计标准司(Division of Statistical Standards in the U.S.Bureau of the Budget)。Stouffer著作的一个特点是他非常专注于使用实证数据和量化分析方法来严格检验有关社会过程的想法,他去世后的文集《检验想法的社会研究文集》(Social Research to Test Ideas,1962)就是最好的证明。
1702645092
1702645093
1702645094
1702645095
1702645097
量化数据分析:通过社会研究检验想法 列联表
1702645098
1702645099
判断信教黑人是否比不信教的黑人更可能(或更不可能)表现激进的方法有多种。也许最直接的方法是按宗教信仰虔诚度和激进类别做列联表,即计算每一类宗教信仰虔诚度与激进类别组合的人数的频数。宗教信仰虔诚度有四类,激进类别有两类,因此这两个变量有八种组合。在Marx的抽样中,按宗教信仰虔诚度和激进类别做的列联表产生了下面的联合频数分布(见表1-1)。
[
上一页 ]
[ :1.70264505e+09 ]
[
下一页 ]