打字猴:1.702640395e+09
1702640395 应用卡方检验所需的每格计数的下限
1702640396
1702640397 当预期计数小于5的格所占比例不超过20%,而且每一格的预期计数都至少是1时,就可使用卡方检验。
1702640398
1702640399 可卡因成瘾实验轻易就满足了这一要求,它所有格的预期计数不是8就是16。
1702640400
1702640401 例6 易怒的人是否更易患心脏病?
1702640402
1702640403 易怒的人似乎比较容易患心脏病。这是一项历时约4年的研究所得出的结论,该研究追踪了三地共计12986人的随机样本。所有实验对象在研究开始之前都没有心脏病,他们接受了斯皮尔伯格发怒量表测试,该量表用来度量一个人的易怒程度。以下是样本中血压正常的8474人的数据。CHD代表冠心病患者,包括患过急性心脏病的人,以及需要治疗的心脏病患者。
1702640404
1702640405
1702640406
1702640407
1702640408 我们可以从中看到明显的趋势:易怒程度越高,患心脏病的百分比就越高。易怒程度和患心脏病之间的相关关系是否具有统计学显著性?
1702640409
1702640410 第一步先把数据用双向表表示,并加进没有心脏病的人的计数。我们还加上了在计算预期计数时需要用到的行总数及列总数。
1702640411
1702640412
1702640413
1702640414
1702640415 接下来,我们可以执行显著性检验的步骤了,这在本书第22章中已经介绍过的。
1702640416
1702640417 假设
1702640418
1702640419 卡方检验主要检验下列假设:
1702640420
1702640421 H0:易怒程度和CHD之间没有相关关系
1702640422
1702640423 Ha:易怒程度和CHD之间有相关关系
1702640424
1702640425 抽样分布
1702640426
1702640427 所有格的预期计数都比5大,所以我们可以放心使用卡方检验。双向表有2行3列,我们将从自由度df=(2-1)(3-1)=2的卡方分布中寻找临界值。
1702640428
1702640429 数据
1702640430
1702640431 先算出各个格的预期计数。举例来说,易怒程度高且有CHD的那一格,其预期计数是:
1702640432
1702640433
1702640434
1702640435
1702640436 以下是同时列出所有观察到的计数与预期计数的双向表:
1702640437
1702640438
1702640439
1702640440
1702640441 检视这些计数就会看出,高易怒程度组的CHD人数比预期计数高,而低易怒程度组的CHD人数比预期计数低。这个结果和例6中所列出的百分比一致。卡方统计量为:
1702640442
1702640443
1702640444
[ 上一页 ]  [ :1.702640395e+09 ]  [ 下一页 ]