打字猴:1.702639435e+09
1702639435
1702639436
1702639437 让全部50名实验对象品尝两杯没做记号的咖啡,并说出自己喜欢哪一杯。两杯中,一杯是速溶咖啡,一杯是现煮咖啡。用实验结果得到的统计量,计算样本中比较喜欢现煮咖啡的人的比例。结果,50位实验对象中有36位选择了现煮咖啡,样本比例是:
1702639438
1702639439
1702639440
1702639441
1702639442 为了清楚说明我们的观点,用这个结果与另一个可能的结果做比较。如果50位实验对象中只有28位更喜欢现煮咖啡,样本比例是:
1702639443
1702639444
1702639445
1702639446
1702639447 当然,用72%这个数据否定那位怀疑者的断言,比56%更有说服力。但是,差别有多大呢?即使样本中有72%的人喜欢现煮咖啡,就可以成为总体中大部分人都如此的有力证据吗?统计学显著性检验可以回答这个问题。
1702639448
1702639449 • 断言。怀疑者认为喝咖啡的人喝不出速溶咖啡和现煮咖啡的区别。换言之,喜欢现煮咖啡的人的总体比例p只有0.5。假设这个断言是正确的。
1702639450
1702639451
1702639452 • 抽样分布。如果断言p=0.5是正确的,我们检验了许多个包含50位喝咖啡的人的随机样本,样本比例的值会随样本而变化,其分布近似于正态分布。
1702639453
1702639454
1702639455
1702639456
1702639457 图22-1展示了这条正态分布曲线。
1702639458
1702639459
1702639460 • 数据。把样本比例的值标示在抽样分布图中,从图22-1上可以看到,p=0.56这个值很正常,而p=0.72就很奇怪了。如果喝咖啡的人里只有50%喜欢现煮咖啡,那么在50位喝咖啡的人的样本中,出现72%的人喜欢现煮咖啡的情况会非常少见。所以,样本数据提供了不利于断言的证据。
1702639461
1702639462
1702639463
1702639464
1702639465 图22-1 在50位喝咖啡的人中,喜欢现煮咖啡者所占比例的抽样分布。这个分布成立的前提是,所有喝咖啡者中有50%的人喜欢现煮咖啡,阴影区的面积为样本比例至少是56%的概率
1702639466
1702639467
1702639468
1702639469
1702639470 • 概率。我们可以用概率来度量对断言不利的证据到底有多强。当总体比例p=0.5时,一个样本的值会跟p差不多大甚至更大的概率是多少?若=0.56,这个概率就是图22-1中正态曲线下方阴影区的面积,为0.20。若样本比例=0.72,只有0.001的概率会得到这个结果,对应的区域小到在图上几乎无法看清。在所有样本中,仅因为随机性就有20%的发生概率的结果,无法作为断言不正确的有力证据。但是,在1000次当中只发生一次的结果,却是好的证据。
1702639471
1702639472 要确定你真的理解了为什么这个证据令人信服。有两种可能的解释,可以说明为什么会得到“实验对象中有72%的人比较喜欢现煮咖啡”的结果:
1702639473
1702639474 (1)怀疑者是对的(p=0.5),但是因为他运气太差,本来极不可能发生的结果却发生了。
1702639475
1702639476 (2)事实上,总体中偏好现煮咖啡者的比例大于0.5,所以样本结果差不多就是预期的总体结果。
1702639477
1702639478 我们不能断定(1)一定不对,因为我们的测试结果有可能真的只是随机性造成的。但是,这样的结果完全是由随机性造成的概率非常小(0.001),所以,我们有信心认为(2)才是对的。
1702639479
1702639480 假设和P值
1702639481
1702639482 在大部分的研究中,我们都想证明总体中有某种特定的效应。比如在例1中,我们猜想大部分喝咖啡的人都偏好现煮咖啡。为方便讨论,统计学显著性检验会先假设我们要找的效应并不存在。然后,我们开始寻找不利于这个假设的证据,从而验证我们想找的效应确实存在。统计学显著性检验的第一步是先列出一个断言,再试着找到证据否定它。
1702639483
1702639484 零假设H0
[ 上一页 ]  [ :1.702639435e+09 ]  [ 下一页 ]