1702639495
1702639496
显著性检验会找出对零假设不利,但对备择假设有利的证据。如果观察到的结果在零假设为真的情况下是出人意料的,而在备择假设为真时却较易发生,这个证据就很强。比如,虽然事实上总体中只有一半人喜欢现煮咖啡,但实验却发现50人中有36人喜欢现煮咖啡,这就会出人意料。有多么出人意料呢?显著性检验用概率来回答这个问题。这个概率指的是,在H0正确时得到的结果跟预期结果差距很大的概率,而且这个差距至少要等于(或大于)实际观察值与预期结果的差距。怎样才算“跟预期结果的差距很大”?这既和H0有关,也和Ha有关。在口味实验中,我们希望得到的概率,就是在50人中至少有36人喜欢现煮咖啡的概率。如果零假设p=0.5正确,上述的这个概率就会非常小(0.001)。这就是零假设不正确的有力证据。
1702639497
1702639498
知识普及 逮到你了!
1702639499
1702639500
查税员怀疑“剥削公司”常常开假支票来给支出项目“灌水”,以达到减税的目的。她想查出真相,但又不想检查每一张支票,于是用电脑帮忙。真实数据的第一位数字遵循着人所共知的规律,即并不是从0到9每个数字的出现概率都一样。如果支票上的金额不符合这个规律,她就会深入调查。同一条街上,有个黑客正试图窥探某家公司的电脑档案,因为档案经过加密,所以他没法读取。但还是有办法找到解码的钥匙,就是每个符号的出现概率都一样的唯一一长串符号。查税员和黑客都需要一种方法来检查他们要找的模式是否存在。
1702639501
1702639502
P值
1702639503
1702639504
统计检验的P值(P-value)是在H0为真的假设下,所得到的样本结果会像实际观察结果那么极端或更极端的概率。P值越小,数据所提供的否定H0的证据就越强。
1702639505
1702639506
在实际应用时,大部分的统计检验可以由会计算P值的电脑软件来执行。在许多领域我们都可见到用P值来描述研究结果的现象。所以,即使你自己不做统计检验,也应该知道P值的意义,就像虽然你自己不用计算置信区间,也应该了解“95%置信度”是什么意思。
1702639507
1702639508
1702639509
1702639510
1702639511
布冯伯爵抛硬币实验的真相
1702639512
1702639513
例2 布冯伯爵抛硬币实验
1702639514
1702639515
法国自然主义者布冯伯爵抛了4040次硬币,有2048次正面朝上,正面朝上的样本比例是:
1702639516
1702639517
1702639518
1702639519
1702639520
这个结果比0.5稍多一点儿。这是不是布冯的硬币不平衡的证据呢?此时显著性检验可以登场了。
1702639521
1702639522
假设。零假设说硬币是平衡的(p=0.5)。在我们看到数据之前,并没有怀疑硬币会偏向哪一面,所以备择假设只是“硬币不平衡”。两个假设分别是:
1702639523
1702639524
H0:p=0.5
1702639525
1702639526
Ha:p≠0.5
1702639527
1702639528
样本分布。如果零假设为真,样本中正面朝上的比例就会近似于正态分布:
1702639529
1702639530
1702639531
1702639532
1702639533
1702639534
数据。图22-2展示了这个抽样分布,并标示出布冯的样本结果=0.507。我们从图上就可以看出样本结果很正常,无法提供否定p=0.5断言的证据。
1702639535
1702639536
1702639537
1702639538
1702639539
图22-2 抛硬币4040次,正面朝上比例的抽样分布。布冯伯爵得到的正面朝上的样本比例标示如图
1702639540
1702639541
1702639542
1702639543
1702639544
P值。得到结果和0.5的差距与样本结果0.507和0.5的差距一样大的概率是多少?因为备择假设的值可能在0.5的左边,也可能在它的右边,值往左右任何一侧偏离0.5,都可提供否定H0而支持Ha的证据。因此,P值是观察值往左右任何一侧偏离0.5的程度至少和=0.507相同的概率。图22-3用正态曲线下方的面积来表示这个概率p=0.37。
[
上一页 ]
[ :1.702639495e+09 ]
[
下一页 ]