1702640305
1702640306
想知道数据是否提供了不利于“没有相关关系”的零假设的证据,我们得把双向表里的计数和零假设为真时我们的预期计数做比较。如果观察到的计数和预期计数相差很多,我们就得到了想找的证据。这个检验用了一项统计量来度量观察到的计数与预期计数到底相差多少。
1702640307
1702640308
卡方统计量
1702640309
1702640310
卡方统计量(chi-square statistic)度量的是从双向表中观察到的计数和预期计数之间的差距,用χ2表示。卡方统计量的公式是:
1702640311
1702640312
1702640313
1702640314
1702640315
1702640316
符号代表“表中每一格数字的加总”。
1702640317
1702640318
卡方统计量是许多项数字的和,每一项对应双向表中的一格。在可卡因成瘾的例子中,去郁敏组中有14人戒瘾成功,而这一格的预期计数是8人。所以,卡方统计量中对应这一格的数字是:
1702640319
1702640320
1702640321
1702640322
1702640323
知识普及 其他卡方检验
1702640324
1702640325
有的卡方检验处理的是比“没有相关关系”更明确的假设。将某些人依社会地位分等级,10年后,再对同一批人重新分等级。列变量和行变量分别是两个不同时间的社会等级。我们可以检验社会地位的总体分布并没有改变的假设,也可以检验社会地位上升的人和下降的人比例差不多的假设。某些统计检验可以处理这种以及其他种类的假设。
1702640326
1702640327
例4 可卡因成瘾
1702640328
1702640329
下表是可卡因实验中观察到的计数和预期计数:
1702640330
1702640331
1702640332
1702640333
1702640334
现在,我们可以算出卡方统计量,只要将双向表中6个格子对应的项加起来即可:
1702640335
1702640336
1702640337
1702640338
1702640339
练习
1702640340
1702640341
24.2 玩游戏和学习成绩。计算机、视频、在线和虚拟现实游戏的普及,引发了它们是否会对年轻人产生负面影响的讨论。近期的一项调查对康涅狄格州高中的1808名14~18岁的学生,按照其学习成绩和是否玩过这类游戏进行分类。下表是该调查发现的情况,同时给出了观察到的计数和预期计数:
1702640342
1702640343
1702640344
1702640345
1702640346
请你计算卡方统计量。
1702640347
1702640348
因为χ2度量的是观察到的计数与H0为真时的预期计数的差距,所以如果它的值偏大,就是不利于H0的证据。χ2=10.5算不算大呢?你知道该怎么处理:把10.5这个观察值和χ2的抽样分布做比较,χ2的抽样分布会展示出在零假设为真时χ2的值会有怎样的变化。这个抽样分布不是正态分布,而是右偏分布,又因为χ2的值不可能为负,所以它只包含大于0的值。此外,对应不同大小的双向表,抽样分布也会不同。
1702640349
1702640350
卡方分布
1702640351
1702640352
当“没有相关关系”的零假设为真时,卡方统计量χ2的抽样分布叫作“卡方分布”(chi-square distribution)。
1702640353
1702640354
卡方分布是一整组分布,只有正值且是右偏的。特定的卡方分布是由它的“自由度”(degrees of freedom)决定的。
[
上一页 ]
[ :1.702640305e+09 ]
[
下一页 ]