1702630890
1702630891
• 对于大小为n的简单随机样本,在置信度为95%的情况下,我们可以用1/这个公式来计算误差范围。这个公式似乎表明,重要的是样本的大小,而不是总体的大小。只要总体比样本大很多(至少大100倍),这一个原则就永远为真。
1702630892
1702630893
在第1章,我们介绍了抽样调查是一种重要的观察研究。在第2章,我们讨论了抽样调查的好的方法和不好的方法。简单随机抽样的方法被引入,它是一种能够巧妙地利用随机性产生无偏差数据的方法,这是统计学中的一个重要概念。
1702630894
1702630895
在本章中,我们更详细地探讨了如何通过样本信息获得总体的信息。关键在于如果我们从同一个总体中取出多个样本,会发生什么情况。如果所有样本都给出非常接近真实值的结果,我们就可以相信样本。
1702630896
1702630897
在实践中,选取一个简单随机样本到底是容易还是难呢?我们在现实世界中抽取样本时,会碰到什么问题?这是下一章要讲的内容。
1702630898
1702630899
案例分析与评估
1702630900
1702630901
在本章开头的那个案例里,在2004年的一项盖洛普民意调查中,有51%的调查对象支持小布什提出的宪法修正案,反对同性婚姻。51%的支持率是否意味着2004年时大多数美国成年人支持该修正案?2011年的盖洛普民意调查表明,大多数(53%)的调查对象反对这项修正案,这是否意识着2011年时大多数美国成年人反对该修正案?用本章所学的知识回答这两个问题。你可以将答案写下来,以便没有学过统计学的人能了解你的推理过程。
1702630902
1702630903
练习
1702630904
1702630905
3.1见本书第51页。
1702630906
1702630907
3.2见本书第54页。
1702630908
1702630909
3.3 下面的黑体数字是参数还是统计量?美国劳工部宣布,在上个月调查了60000个住户样本中所有属于劳动人口的人,其中有9.7%的人失业。
1702630910
1702630911
3.4 下面的黑体数字是参数还是统计量?一辆满载滚珠轴承的货车,平均直径是2.503厘米,在买主对整批货的可接受范围之内。检查者从这批货中抽验100个滚珠轴承,得到的平均直径是2.515厘米,超过买主的可接受范围,所以整批滚珠轴承被买主退货了。
1702630912
1702630913
3.5 下面的黑体数字是参数还是统计量?选民登记记录显示,费城选民中有15.4%的人为共和党人。然而,该市的一个电台脱口秀节目发现,在最近致电给他们的20位本地居民中,有60%的人为共和党人。
1702630914
1702630915
3.6 下面的黑体数字是参数还是统计量?一个全国性民意调查机构利用一种随机拨号装置,拨打全国的住宅电话。在最先拨打的100个号码当中,有32个是未登记的。这并不令人惊讶,因为全美国有34%的住宅电话,没有被住宅电话号码随机抽样调查抽中。
1702630916
1702630917
1702630918
3.7 抽取多个样本实验。图3–1和图3–2显示出,当我们从同一个总体抽取多个样本时,样本统计量的情况。你可以依照同样的步骤,做一个小型实验。
1702630919
1702630920
图3–4当中是一个小型总体,其中每一个圆圈代表一个成年人。白色圆圈代表赞成小布什提出的宪法修正案的人,而灰色圆圈代表持反对意见的人。你可以数一下,在总共100个圆圈当中,有50个是白色的,所以在这个总体当中,支持者的比例是p=50/100=0.5。
1702630921
1702630922
1702630923
(a)圆圈上面有从00、01到99的编号。用表A从第101行开始抽出大小为4的简单随机样本。在你的样本当中,赞成修正案的人的比例是多少?
1702630924
1702630925
1702630926
(b)再取9个大小为4的简单随机样本(总共有10个简单随机样本),这次用表A的第102行到第110行抽取样本,每一行对应一个样本。这样一来,你就有10个样本的值了,将这10个值写下来。
1702630927
1702630928
1702630929
1702630930
(c)因为你的样本里面只有4个人,所以可能的值只有0/4、1/4、2/4、3/4及4/4,也就是必定是0、0.25、0.5、0.75或1中的一个。在一条直线上把这些数字标示出来,并且用这10个数字做出一个柱状图,做法是在每个数字上画一条垂直的线段,线段的长度就是结果等于该数字的样本个数。
1702630931
1702630932
(d)从一个大小为100的总体中抽取一个大小为4的样本,当然不是一个很实际的做法,但不管怎样,我们还是来看看你的结果。在你的10个样本当中,有几个把总体参数值(p=0.5)估计得完全正确?对于你所有的样本统计量来说,总体参数的真实值0.5是不是大致在中间的位置?说明一下在抽取多个样本的情况下,为什么0.5会在所有样本统计值的中间位置。
1702630933
1702630934
1702630935
1702630936
1702630937
图3–4 练习3.7中总体的100个个体,一些个体(白色圆圈)支持修正案,而另一些个体则持反对意见
1702630938
1702630939
3.8 抽取多个样本的实验。我们用小总体当中的小样本,来说明样本统计量的变异性。下列25位俱乐部会员当中有10位是女性,她们的名字旁边标记了星号。俱乐部要随机选出5位会员,为他们免费提供去参加全国大会的机会。
[
上一页 ]
[ :1.70263089e+09 ]
[
下一页 ]