1702640402
1702640403
易怒的人似乎比较容易患心脏病。这是一项历时约4年的研究所得出的结论,该研究追踪了三地共计12986人的随机样本。所有实验对象在研究开始之前都没有心脏病,他们接受了斯皮尔伯格发怒量表测试,该量表用来度量一个人的易怒程度。以下是样本中血压正常的8474人的数据。CHD代表冠心病患者,包括患过急性心脏病的人,以及需要治疗的心脏病患者。
1702640404
1702640405
1702640406
1702640407
1702640408
我们可以从中看到明显的趋势:易怒程度越高,患心脏病的百分比就越高。易怒程度和患心脏病之间的相关关系是否具有统计学显著性?
1702640409
1702640410
第一步先把数据用双向表表示,并加进没有心脏病的人的计数。我们还加上了在计算预期计数时需要用到的行总数及列总数。
1702640411
1702640412
1702640413
1702640414
1702640415
接下来,我们可以执行显著性检验的步骤了,这在本书第22章中已经介绍过的。
1702640416
1702640417
假设
1702640418
1702640419
卡方检验主要检验下列假设:
1702640420
1702640421
H0:易怒程度和CHD之间没有相关关系
1702640422
1702640423
Ha:易怒程度和CHD之间有相关关系
1702640424
1702640425
抽样分布
1702640426
1702640427
所有格的预期计数都比5大,所以我们可以放心使用卡方检验。双向表有2行3列,我们将从自由度df=(2-1)(3-1)=2的卡方分布中寻找临界值。
1702640428
1702640429
数据
1702640430
1702640431
先算出各个格的预期计数。举例来说,易怒程度高且有CHD的那一格,其预期计数是:
1702640432
1702640433
1702640434
1702640435
1702640436
以下是同时列出所有观察到的计数与预期计数的双向表:
1702640437
1702640438
1702640439
1702640440
1702640441
检视这些计数就会看出,高易怒程度组的CHD人数比预期计数高,而低易怒程度组的CHD人数比预期计数低。这个结果和例6中所列出的百分比一致。卡方统计量为:
1702640442
1702640443
1702640444
1702640445
1702640446
实际应用时可用统计软件做所有的计算。看一下相加得出χ2的那6个数字,我们可以发现χ2的值主要是由其中一格“贡献”的,即高于预期计数的高易怒程度组的CHD人数。
1702640447
1702640448
有统计学显著性吗?
1702640449
1702640450
在表24-1中查df=2那一行。我们算出的卡方统计量χ2为16.083,比α=0.001对应的临界值13.82要大。我们获得了具有统计学显著性(P<0.001)的证据,证明易怒程度和患心脏病的确有关。统计软件可以算出实际的P值,即P=0.0003。
1702640451
[
上一页 ]
[ :1.702640402e+09 ]
[
下一页 ]