1702640435
1702640436
以下是同时列出所有观察到的计数与预期计数的双向表:
1702640437
1702640438
1702640439
1702640440
1702640441
检视这些计数就会看出,高易怒程度组的CHD人数比预期计数高,而低易怒程度组的CHD人数比预期计数低。这个结果和例6中所列出的百分比一致。卡方统计量为:
1702640442
1702640443
1702640444
1702640445
1702640446
实际应用时可用统计软件做所有的计算。看一下相加得出χ2的那6个数字,我们可以发现χ2的值主要是由其中一格“贡献”的,即高于预期计数的高易怒程度组的CHD人数。
1702640447
1702640448
有统计学显著性吗?
1702640449
1702640450
在表24-1中查df=2那一行。我们算出的卡方统计量χ2为16.083,比α=0.001对应的临界值13.82要大。我们获得了具有统计学显著性(P<0.001)的证据,证明易怒程度和患心脏病的确有关。统计软件可以算出实际的P值,即P=0.0003。
1702640451
1702640452
结论
1702640453
1702640454
我们能不能就此下结论说易怒会导致人们患心脏病呢?这是一项观察研究,而不是实验。如果有些潜在变量和易怒交叉产生影响,也不会让人感到意外。比如,易怒的人与其他人相比,更有可能是既喝酒又抽烟的男性。研究报告中用了高等统计学,对三组易怒程度不同的人之间的许多种差异做了调整。经过调整之后,P值从P=0.0003上升到了P=0.02,因为潜在变量可以对人们患心脏病做出部分解释。但是,这个结果仍然是相关关系存在的合理证据。因为研究是从没有CHD的人的随机样本开始的,通过追踪观察这些人,并对许多潜在变量进行度量和解释,所以研究结果的确可以提供部分证据。下一步我们也许应该做个实验,看易怒的人应该做出何种改变,从而降低他们患心脏病的风险?
1702640455
1702640456
辛普森悖论
1702640457
1702640458
在有数值变量的情况下,潜在变量的影响会改变甚至消除两个类别变量之间的关系。我们继续研究例1和例2所提及的招生性别歧视问题。为了便于说明问题,这些数字都做了人工处理,但足以展示经常在实际数据中出现的情况。
1702640459
1702640460
例7 招生性别歧视
1702640461
1702640462
一所大学计划只招收两个专业的学生,一个是工程学,一个是英语。申请这两个专业是竞争性的,女权组织怀疑在录取过程中存在歧视女性的问题。他们从该所大学获得了以下数据,这是一个关于所有申请人的性别和录取状态的双向表:
1702640463
1702640464
1702640465
1702640466
1702640467
我们研究了例1和例2中的数据,发现在申请者的性别和录取比例之间存在相关性。特别是:
1702640468
1702640469
1702640470
1702640471
1702640472
啊哈!近乎一半的男性申请者被录取了,而女性申请者中只有1/3的人被录取。这难道不是歧视女性的证据吗?
1702640473
1702640474
该大学回复说,尽管这个相关性是正确的,但这并不是因为歧视女性。为了做出反驳,该大学列了一个三向表(three-way table),将申请者按照性别、录取状态和申请专业进行分类。我们把一个三向表用两个或更多个双向表并排展示出来,每个表示三个变量中的一个。在这里是两个双向表,每个代表一个专业:
1702640475
1702640476
1702640477
1702640478
1702640479
我们现在可以看出,工程学专业正好录取了男性申请者和女性申请者中的各一半,英语专业则录取了男性申请者和女性申请者中的各1/4。在这两个专业里,都没有出现性别和录取比例之间的相关性。
1702640480
1702640481
在任何一个专业中都没有相关性,却为何在整合之后产生了强相关关系呢?我们观察数据可知:英语专业很难申请,而大多数女性申请者都申请了这个专业;工程系更容易申请,但它吸引的主要是男性申请者。申请英语专业的有40名女性和20名男性,申请工程专业的有60名男性和20名女性。原来的双向表并没有反映出这种专业之间的差异,具有误导性。这是“辛普森悖论”(Simpsom’s Paradox)的一个例子。
1702640482
1702640483
1702640484
[
上一页 ]
[ :1.702640435e+09 ]
[
下一页 ]