1702640235
1702640236
1702640237
双向表所提供的信息,不只是单独的录取状态分布和性别分布。录取状态和性别之间有何关系,没有办法从个别分布当中找出来,必须用整个双向表。要描述类别变量之间的相关关系,可根据表中所给的计数,计算出百分比。
1702640238
1702640239
例2 招生性别歧视
1702640240
1702640241
由于只有两种录取状态,我们通过比较男女性申请者被录取的百分比,来看性别和录取状态之间的关系:
1702640242
1702640243
1702640244
1702640245
1702640246
男性申请者中几乎有1/2被录取,而女性申请者中只有1/3的人被录取。
1702640247
1702640248
用双向表的时候必须计算多个百分比,有个办法可以帮你决定用哪些分数才可以算出你想要的百分比。你要问自己:“我要的百分比是哪一个整体的百分比?”该整体的计数,就是你计算百分比时所用分数的分母。在例2中我们要计算的是每一种性别的录取比例,所以每一种性别的计数就是分母。
1702640249
1702640250
双向表的推断
1702640251
1702640252
我们常常搜集数据,并列出双向表来探讨两个类别变量之间是否有相关关系。检视样本数据很容易:算出百分比,再看行变量和列变量之间有没有相关关系。样本显示出相关关系,是不是就意味着总体中的这两个变量有相关关系?还是样本中的相关关系只是因为巧合而发生?这是显著性检验要回答的问题。
1702640253
1702640254
例3 可卡因成瘾
1702640255
1702640256
吸食可卡因成瘾的人需要靠它得到快感,也许给这些人服用抗抑郁的药,能帮助他们戒掉可卡因瘾。有一项历时三年的研究,把一种叫作去郁敏的抗抑郁剂和锂盐(治疗可卡因成瘾的标准用药)的疗效与安慰剂做了比较。实验对象是72位常年吸食可卡因但想要戒掉它的人。每一种处理方式都随机分配了24个人。以下是在研究期间,成功做到不再吸食可卡因的人数和百分比:
1702640257
1702640258
1702640259
1702640260
1702640261
1702640262
1702640263
1702640264
图24-1 三种可卡因成瘾治疗方法的成功比例柱状图
1702640265
1702640266
各组实验对象中成功做到不再吸食可卡因人数的比例有很大差别,去郁敏看上去要比锂盐和安慰剂的效果好很多。从图24-1中可以看到这个差别。这是不是合理证据,表明在所有可卡因瘾君子的总体中,处理方式和结果之间确实存在相关关系?
1702640267
1702640268
可以为这个问题提供答案的显著性检验,建立在一个双向表的基础上,如下所示:
1702640269
1702640270
1702640271
1702640272
1702640273
我们的零假设应该是各种处理方式都没有效果,也就是说,瘾君子在三种处理方式影响下的表现都一样,样本显示的差异不过是随机性造成的。
1702640274
1702640275
H0:在所有可卡因瘾君子的总体当中,处理方式和戒瘾成功之间没有相关关系。
1702640276
1702640277
把这个零假设用总体参数表示会有一点儿复杂,所以我们用这样的叙述就可以了。备择假设是:瘾君子所接受的处理方式和其能否成功戒除可卡因瘾,二者之间的确存在相关关系。备择假设并没有指明相关关系的本质,比如,备择假设没有说“使用去郁敏的瘾君子,比使用锂盐或安慰剂的瘾君子,更有可能戒瘾成功”。
1702640278
1702640279
要检验H0,我们会把从双向表中观察到的计数和“预期计数”(expected count)做比较。预期计数是当H0为真时,我们所预测到的计数(除了随机性变异外)。如果观察到的计数和预期计数相差很大,就是不利于H0的证据。我们可以算出该实验的预期计数。就全部实验对象而言,72人中有24人戒瘾成功,这代表总体成功率是1/3,因为24/72等于1/3。如果零假设为真,各处理方式之间就没有差别。所以,我们预期每一组当中都有1/3的人戒瘾成功。每组中有24人,预期计数就是每组中有8人成功,16人失败。如果每组的人数不尽相同,则预期计数也会不同,即使我们预期每一组的成功比例相同。有一个公式可以帮我们轻易算出预期计数:
1702640280
1702640281
预期计数
1702640282
1702640283
当H0为真时,双向表中任意一格的预期计数为:
1702640284
[
上一页 ]
[ :1.702640235e+09 ]
[
下一页 ]