打字猴:1.702639485e+09
1702639485
1702639486 在统计学显著性检验中,被检验的断言叫作“零假设”(null hypothesis)。检验主要评估否定零假设的证据有多强。通常情况下,零假设都是“没有效应”或“没有差别”之类的叙述。
1702639487
1702639488 零假设用H0代表,读法是“H零”。H0是关于总体的叙述,所以一定要用总体参数来表示。例1当中的参数是在所有喝咖啡的人中偏爱现煮咖啡者的比例p。零假设是:
1702639489
1702639490 H0:p=0.5
1702639491
1702639492 我们希望能够取代H0的那个叙述,叫作“备择假设”(alternative hypothesis),用Ha表示。在例1中,备择假设就是喝咖啡的人大多偏好现煮咖啡。用总体参数表示就是:
1702639493
1702639494 Ha:p>0.5
1702639495
1702639496 显著性检验会找出对零假设不利,但对备择假设有利的证据。如果观察到的结果在零假设为真的情况下是出人意料的,而在备择假设为真时却较易发生,这个证据就很强。比如,虽然事实上总体中只有一半人喜欢现煮咖啡,但实验却发现50人中有36人喜欢现煮咖啡,这就会出人意料。有多么出人意料呢?显著性检验用概率来回答这个问题。这个概率指的是,在H0正确时得到的结果跟预期结果差距很大的概率,而且这个差距至少要等于(或大于)实际观察值与预期结果的差距。怎样才算“跟预期结果的差距很大”?这既和H0有关,也和Ha有关。在口味实验中,我们希望得到的概率,就是在50人中至少有36人喜欢现煮咖啡的概率。如果零假设p=0.5正确,上述的这个概率就会非常小(0.001)。这就是零假设不正确的有力证据。
1702639497
1702639498 知识普及 逮到你了!
1702639499
1702639500 查税员怀疑“剥削公司”常常开假支票来给支出项目“灌水”,以达到减税的目的。她想查出真相,但又不想检查每一张支票,于是用电脑帮忙。真实数据的第一位数字遵循着人所共知的规律,即并不是从0到9每个数字的出现概率都一样。如果支票上的金额不符合这个规律,她就会深入调查。同一条街上,有个黑客正试图窥探某家公司的电脑档案,因为档案经过加密,所以他没法读取。但还是有办法找到解码的钥匙,就是每个符号的出现概率都一样的唯一一长串符号。查税员和黑客都需要一种方法来检查他们要找的模式是否存在。
1702639501
1702639502 P值
1702639503
1702639504 统计检验的P值(P-value)是在H0为真的假设下,所得到的样本结果会像实际观察结果那么极端或更极端的概率。P值越小,数据所提供的否定H0的证据就越强。
1702639505
1702639506 在实际应用时,大部分的统计检验可以由会计算P值的电脑软件来执行。在许多领域我们都可见到用P值来描述研究结果的现象。所以,即使你自己不做统计检验,也应该知道P值的意义,就像虽然你自己不用计算置信区间,也应该了解“95%置信度”是什么意思。
1702639507
1702639508
1702639509
1702639510
1702639511 布冯伯爵抛硬币实验的真相
1702639512
1702639513 例2 布冯伯爵抛硬币实验
1702639514
1702639515 法国自然主义者布冯伯爵抛了4040次硬币,有2048次正面朝上,正面朝上的样本比例是:
1702639516
1702639517
1702639518
1702639519
1702639520 这个结果比0.5稍多一点儿。这是不是布冯的硬币不平衡的证据呢?此时显著性检验可以登场了。
1702639521
1702639522 假设。零假设说硬币是平衡的(p=0.5)。在我们看到数据之前,并没有怀疑硬币会偏向哪一面,所以备择假设只是“硬币不平衡”。两个假设分别是:
1702639523
1702639524 H0:p=0.5
1702639525
1702639526 Ha:p≠0.5
1702639527
1702639528 样本分布。如果零假设为真,样本中正面朝上的比例就会近似于正态分布:
1702639529
1702639530
1702639531
1702639532
1702639533
1702639534 数据。图22-2展示了这个抽样分布,并标示出布冯的样本结果=0.507。我们从图上就可以看出样本结果很正常,无法提供否定p=0.5断言的证据。
[ 上一页 ]  [ :1.702639485e+09 ]  [ 下一页 ]