打字猴:1.702639411e+09
1702639411 统计学的世界(第8版) [:1702629698]
1702639412 统计学的世界(第8版) 第22章 什么是显著性检验
1702639413
1702639414 案例分析
1702639415
1702639416 2011年1月26日,《纽约时报》的一篇文章报道了大学新生的压力水平。造成这种情况的根本原因是什么呢?
1702639417
1702639418 自从1985年以来,每年加利福尼亚大学洛杉矶分校的高等教育研究所都会对大学新生进行抽样调查。2010年的抽样调查样本是从全美279所本科学院和大学的150万全日制新生中随机选取的201818名学生。令人困惑的是,在2010年的调查报告中,心理健康状况“高于平均水平”的学生比例创下历史新低,为51.9%,比2009年的55.3%还要低。类似的趋势是,经常“面临各种压力”的学生比例达到29.1%,比2009年的27.1%有所增加。
1702639419
1702639420 《纽约时报》这篇文章报道的这些现象与校园指导员们的经验是吻合的,他们每天都在办公室里接待垂头丧气、压力重重以及需要心理辅导的学生。一位指导员评论说,经济状况、学生贷款和对毕业后就业状况的顾虑都对学生们的心理健康产生了影响。同时,通过问学生问题让其评估自身的心理健康水平,与其他人所做的评估也很难进行对比,因为这需要学生自己定义心理健康,并在与其他人比较时自行做出判断。
1702639421
1702639422 一方面,2009年的抽样调查样本量是219864人,所以这两次抽样调查的结果都来自非常大的样本。另一方面,百分比的变化很小,区别会不会是由抽样时的随机性造成的呢?
1702639423
1702639424 在这一章,我们讨论显著性检验的方法,帮助我们判断某个观察到的区别是否可以归因于随机性。学完本章,你将了解如何解释这类检验,以及高等教育研究所对大学新生的这项抽样调查结果的差异是否源于偶然性。
1702639425
1702639426 统计学显著性检验的推理
1702639427
1702639428 常常打篮球的一个自以为是的球员声称,他的罚球命中率高达80%。你对他说:“投给我看看。”他投了20个球,结果只投进8个球。“啊哈!”你下结论说,“如果他的命中率真是80%,那么他几乎不大可能投20个球却只中8个。所以,我不相信他的话。”这就是统计学显著性检验在球场上的推理版本:假设在断言正确的情况下,很少会发生的结果却发生了,这就是断言不正确的证据。
1702639429
1702639430 统计推断是利用样本数据来对总体得出结论,所以,统计学显著性检验处理的是有关总体的断言。显著性检验要判断的是,样本数据是否提供了不利于断言的证据。显著性检验说的是:“如果我们取许多样本而且断言正确,我们应该很少会得到这样的结果。”要得到证据强的数值量度,就要把语意模糊的“很少”用概率来代替。
1702639431
1702639432 例1 咖啡是现煮的吗?
1702639433
1702639434 注重口味的人,应该喜欢现煮咖啡多于速溶咖啡。但从另一个角度看,有些喝咖啡的人也可能只是对咖啡因上瘾。一位持怀疑态度的人由此断言:喝咖啡的人喝不出二者的区别。让我们做个实验来检验这个断言正确与否。
1702639435
1702639436
1702639437 让全部50名实验对象品尝两杯没做记号的咖啡,并说出自己喜欢哪一杯。两杯中,一杯是速溶咖啡,一杯是现煮咖啡。用实验结果得到的统计量,计算样本中比较喜欢现煮咖啡的人的比例。结果,50位实验对象中有36位选择了现煮咖啡,样本比例是:
1702639438
1702639439
1702639440
1702639441
1702639442 为了清楚说明我们的观点,用这个结果与另一个可能的结果做比较。如果50位实验对象中只有28位更喜欢现煮咖啡,样本比例是:
1702639443
1702639444
1702639445
1702639446
1702639447 当然,用72%这个数据否定那位怀疑者的断言,比56%更有说服力。但是,差别有多大呢?即使样本中有72%的人喜欢现煮咖啡,就可以成为总体中大部分人都如此的有力证据吗?统计学显著性检验可以回答这个问题。
1702639448
1702639449 • 断言。怀疑者认为喝咖啡的人喝不出速溶咖啡和现煮咖啡的区别。换言之,喜欢现煮咖啡的人的总体比例p只有0.5。假设这个断言是正确的。
1702639450
1702639451
1702639452 • 抽样分布。如果断言p=0.5是正确的,我们检验了许多个包含50位喝咖啡的人的随机样本,样本比例的值会随样本而变化,其分布近似于正态分布。
1702639453
1702639454
1702639455
1702639456
1702639457 图22-1展示了这条正态分布曲线。
1702639458
1702639459
1702639460 • 数据。把样本比例的值标示在抽样分布图中,从图22-1上可以看到,p=0.56这个值很正常,而p=0.72就很奇怪了。如果喝咖啡的人里只有50%喜欢现煮咖啡,那么在50位喝咖啡的人的样本中,出现72%的人喜欢现煮咖啡的情况会非常少见。所以,样本数据提供了不利于断言的证据。
[ 上一页 ]  [ :1.702639411e+09 ]  [ 下一页 ]