打字猴:1.702640405e+09
1702640405
1702640406
1702640407
1702640408 我们可以从中看到明显的趋势:易怒程度越高,患心脏病的百分比就越高。易怒程度和患心脏病之间的相关关系是否具有统计学显著性?
1702640409
1702640410 第一步先把数据用双向表表示,并加进没有心脏病的人的计数。我们还加上了在计算预期计数时需要用到的行总数及列总数。
1702640411
1702640412
1702640413
1702640414
1702640415 接下来,我们可以执行显著性检验的步骤了,这在本书第22章中已经介绍过的。
1702640416
1702640417 假设
1702640418
1702640419 卡方检验主要检验下列假设:
1702640420
1702640421 H0:易怒程度和CHD之间没有相关关系
1702640422
1702640423 Ha:易怒程度和CHD之间有相关关系
1702640424
1702640425 抽样分布
1702640426
1702640427 所有格的预期计数都比5大,所以我们可以放心使用卡方检验。双向表有2行3列,我们将从自由度df=(2-1)(3-1)=2的卡方分布中寻找临界值。
1702640428
1702640429 数据
1702640430
1702640431 先算出各个格的预期计数。举例来说,易怒程度高且有CHD的那一格,其预期计数是:
1702640432
1702640433
1702640434
1702640435
1702640436 以下是同时列出所有观察到的计数与预期计数的双向表:
1702640437
1702640438
1702640439
1702640440
1702640441 检视这些计数就会看出,高易怒程度组的CHD人数比预期计数高,而低易怒程度组的CHD人数比预期计数低。这个结果和例6中所列出的百分比一致。卡方统计量为:
1702640442
1702640443
1702640444
1702640445
1702640446 实际应用时可用统计软件做所有的计算。看一下相加得出χ2的那6个数字,我们可以发现χ2的值主要是由其中一格“贡献”的,即高于预期计数的高易怒程度组的CHD人数。
1702640447
1702640448 有统计学显著性吗?
1702640449
1702640450 在表24-1中查df=2那一行。我们算出的卡方统计量χ2为16.083,比α=0.001对应的临界值13.82要大。我们获得了具有统计学显著性(P<0.001)的证据,证明易怒程度和患心脏病的确有关。统计软件可以算出实际的P值,即P=0.0003。
1702640451
1702640452 结论
1702640453
1702640454 我们能不能就此下结论说易怒会导致人们患心脏病呢?这是一项观察研究,而不是实验。如果有些潜在变量和易怒交叉产生影响,也不会让人感到意外。比如,易怒的人与其他人相比,更有可能是既喝酒又抽烟的男性。研究报告中用了高等统计学,对三组易怒程度不同的人之间的许多种差异做了调整。经过调整之后,P值从P=0.0003上升到了P=0.02,因为潜在变量可以对人们患心脏病做出部分解释。但是,这个结果仍然是相关关系存在的合理证据。因为研究是从没有CHD的人的随机样本开始的,通过追踪观察这些人,并对许多潜在变量进行度量和解释,所以研究结果的确可以提供部分证据。下一步我们也许应该做个实验,看易怒的人应该做出何种改变,从而降低他们患心脏病的风险?
[ 上一页 ]  [ :1.702640405e+09 ]  [ 下一页 ]