1702632854
1702632855
练习
1702632856
1702632857
8.2 最受欢迎的餐馆。每一年Zagat调查公司都会根据数千名食客的投票结果发布洛杉矶最受欢迎餐馆的名单。2010年,In-N-Out餐馆位列第三,但是,2009年它排在第15位。Cafe Bizou餐馆在2010年排在第7位,而在2009年排在第三位。你认为这些排名是有偏差的,或者不可靠的,还是两者都有?请解释。
1702632858
1702632859
知识普及 度量不出的特征也很重要
1702632860
1702632861
1981年,埃德蒙顿油人冰球队中的某位成员,差不多在任何可以度量的指标上都排在末位,比如力量、速度、反应和视野等。这个人就是韦恩·格雷茨基,但他却成了名噪一时的“明星球员”。他在那一年打破了美国国家冰球联盟的得分纪录,并在随后的7个赛季中得到了更高的分数。但是,那些具体指标的测量值却没能表明格雷茨基是历史上最伟大的冰球运动员。所以,并不是所有重要的特征都可以度量出来。
1702632862
1702632863
【统计学中的争议】美国学术能力评估测试分数和大学一年级的成绩
1702632864
1702632865
美国的大学用各式各样的量度来决定招收哪些学生。学生的在校成绩是最重要的,但美国学术能力评估测试分数的影响也很大,尤其是某些很挑剔的大学。美国学术能力评估测试的优点是,它是全国性的测验。“在代数测验中得到A”在不同的中学有不同的意义,但在美国学术能力评估测试的数学部分得到625分,它所代表的意义在美国各地都相同。美国学术能力评估测试没法度量出一个人愿不愿意用功或者其创造力如何,也无法完全准确地预测他进入大学后的表现,但长久以来大多数大学都觉得它有用。
1702632866
1702632867
美国学术能力评估测试分数预测大一学生成绩的效果如何?下方的表中有一些数据,这是2006年从151316名学生的样本中得来的。表里面的数字告诉我们,有多少比例学生的大学成绩,可以用美国学术能力评估测试分数、高中成绩或者美国学术能力评估测试分数加上高中成绩来预测。数字若是0,就代表没有预测有效性,而100%则代表预测完全正确。
1702632868
1702632869
你认为美国学术能力评估测试分数可以预测大学第一年的成绩吗?美国学术能力评估测试成绩是否应被用作大学录取学生的依据?
1702632870
1702632871
1702632872
1702632873
1702632874
增加可靠程度,减少偏差
1702632875
1702632876
现在几点了?许多现代科技都要求非常精确地测量时间,一个例子便是全球定位系统,它利用卫星信号来告诉你你所在的位置。时间根据地球绕太阳的周期计算,绕一圈是一年。但是,地球的公转周期太不稳定了,因此从1967年开始,时间根据标准秒来测量,标准秒的定义是铯原子震动9192631770次所需要的时间。一般的时钟会受温度、湿度和气压改变的影响,铯原子却不受这些因素的影响,所以需要非常精确计时的人可以买原子钟。美国国家标准与技术研究院有一台超级精准的原子钟,通过收音机、电话与互联网报时(不过会在传输过程中产生一点儿误差)。
1702632877
1702632878
例9 非常准确的时间
1702632879
1702632880
美国国家标准与技术研究院的原子钟非常精准,但并非完全精准。世界标准时间是“协调世界时”(Coordinated Universal Time),由位于法国塞夫尔的国际计量局所编制。国际计量局没有比美国国家标准与技术研究院更好的钟,它的时间是用世界各地超过200台原子钟的时间平均计算得来的。美国国家标准与技术研究院告诉我们(事后)他们的时间与正确时间的差距。以下是我们在写作本书时,美国国家标准与技术研究院的最后12项误差,单位是秒。
1702632881
1702632882
0.0000000075 0.0000000012
1702632883
1702632884
0.0000000069 –0.0000000020
1702632885
1702632886
0.0000000067 –0.0000000045
1702632887
1702632888
0.0000000063 –0.0000000046
1702632889
1702632890
0.0000000041 –0.0000000042
1702632891
1702632892
0.0000000032 –0.0000000036
1702632893
1702632894
长期来讲,美国国家标准与技术研究院对时间的量度并没有偏差。美国国家标准与技术研究院的秒有时比国际计量局的短,有时比国际计量局的长,但不是一直较短或一直较长。美国国家标准与技术研究院的量度很可靠,但是从上面的数字还是可以看出有变异。世界上没有百分之百可靠的测量。多个测量值的平均值,比起单次的测量结果,可靠程度更高。这就是国际计量局要用很多原子钟的时间计算平均值的原因之一。
1702632895
1702632896
世界各地的科学家都通过反复测量,并且取多个测量值的平均值来得到比较可靠的结果,学生在做化学实验时也常常这样。就像比较大的样本可以减小样本统计量的变异性一样,用多个测量值的平均值,也可以减小度量结果的变异性。
1702632897
1702632898
用平均值来提升可靠程度
1702632899
1702632900
没有任何度量过程是百分之百可靠的。相比之下,重复度量同一个体再取测量值的平均值,会比单一测量值更可靠(变异性较小)。
1702632901
1702632902
不幸的是,没有一种这么直接的方法可用来减小偏差。偏差大小是由度量工具的好坏决定的。要减小偏差,你就需要用好的工具。美国国家标准与技术研究院的原子钟的准确程度是每600万年的误差为1秒,但要是把它放在你的床边,恐怕体积太大了些。
1702632903
[
上一页 ]
[ :1.702632854e+09 ]
[
下一页 ]