1702631040
1702631041
玛利斯特学院报告说,其中一项抽样调查的误差范围是±9%,而另一个是±2.5%。你认为哪个抽样调查的误差范围是±9%,为什么?
1702631042
1702631043
3.34 模拟(Simulation)。随机数字可被用来模拟随机抽样的结果。假设你要从一个包含许多名大学生的总体里面,抽取一个大小为25的简单随机样本,总体当中有20%的学生在暑假期间没工作。要用随机数字模拟这个简单随机样本的话,我们可以用从表A当中任一处开始的连续25个数字,来代表我们抽取的样本中的学生。用0和1这两个数字代表没工作的学生,其他数字代表有工作的学生。这样的设计是对我们的简单随机样本的一个正确的模拟,因为0和1这两个数字在所有10个被选中的概率相同的数字当中占20%。
1702631044
1702631045
按照以下步骤来模拟50个随机样本的结果,将表A中共50行中的每一行的前25个数字当作一个样本,数一数每个样本当中0和1共有几个。把50个样本的结果,用像图3–1那样的柱状图展示出来。总体参数的真实值(也就是未工作学生的比例,即20%),是不是几乎位于你的柱状图的中间位置?在你的50个样本当中,未工作的学生人数最大是多少,最小是多少?在你的样本里面,有4、5或6个学生没工作的样本数量,占50个样本的百分比是多少?
1702631046
1702631047
3.35 网上练习。浏览www.gallup.com并阅读首页文章。点击More按钮,这篇文章会告诉你在95%置信度下误差范围是多大?
1702631048
1702631049
3.36 网上练习。点击http://media.gallup.com/PDF/FAQ/HowArePolls.pdf,这篇文章给出了盖洛普公司对于为何小样本可以给出关于大总体的可靠结论的解释。这篇文章是怎样解释95%置信度的?
1702631050
1702631051
1702631052
1702631053
1702631055
统计学的世界(第8版) 第4章 真实世界中的抽样调查
1702631056
1702631057
案例分析
1702631058
1702631059
某项民意调查访问了随机抽样的1000个人后,公布了调查结果,其中包括误差范围。我们对此是不是应该满足了呢?恐怕不行,因为有许多调查并没有把和样本相关的信息全部告诉我们。皮尤研究中心(Pew Research Center)效仿几家较好的民意调查机构的做法,然后把调查过程的细节详述如下。
1702631060
1702631061
大部分民意调查是利用电话进行的,用随机拨号的方式取得所有住户的一个随机样本。在剔除传真号码和公司的办公电话之后,皮尤必须拨打2879个住宅电话,才能得到一个1000人的样本。这2879个电话可以分成以下几种情况。
1702631062
1702631063
1702631064
1702631065
1702631066
在2879个有效的住宅电话当中,有33%的电话无人接听。在接听电话的人里面,有35%的人不愿接受访问。无回应(nonresponse)的人(包括不接听电话、不愿接受访谈、未完成访谈的人)为1658人,占2879人的58%。皮尤在5天里,选一个星期中的不同日子和每天的不同时段,每个号码都拨打5次。其他很多调查一般只拨打一次电话,而且在接听电话的人当中,常常有超过一半人不愿接受访问。尽管皮尤研究中心成功地访谈了1000人,我们可以信任这个调查结果吗?学完本章,你就会知道这个问题的答案。
1702631067
1702631068
抽样误差
1702631069
1702631070
随机抽样方法在选取样本时可以消除偏差,也可以控制变异性的大小。那么,是不是只要我们看到“随机抽样”和“误差范围”这两个关键词时,就可以信任调查结果了呢?它当然好于自愿回应的调查方法,但是否像我们期望的那么好,就不一定了。在真实世界里抽样,比起从教科书练习里的名单当中抽一个简单随机样本要复杂得多,结果也较不可靠。置信度说明并不能把真实抽样的所有误差来源都反映出来。
1702631071
1702631072
抽样中发生的误差
1702631073
1702631074
抽样误差(sampling error)是抽样所造成的误差。抽样误差使得样本结果和普查结果不同。
1702631075
1702631076
随机抽样误差(random sampling error)是样本统计量和总体参数之间的差距,是在选取样本时由随机性造成的。置信度说明中的误差范围指的是随机抽样误差。
1702631077
1702631078
非抽样误差(nonsampling error)是和“从总体中抽取样本”这个做法无关的误差。非抽样误差即使在人口普查中也有可能出现。
1702631079
1702631080
大部分的抽样调查都会遇到随机抽样误差以外的误差。这些误差可能导致偏差的产生,使得置信度说明失去意义。好的抽样方法中包含减少各种误差来源的技术。这种技术有一部分是统计科学,因为随机样本与置信度说明都属于统计科学的范畴。然而在实际应用中,要得到好的样本,光靠好的统计方法是不够的。我们来看看抽样调查有些什么样的误差来源,以及调查人员该如何解决。
1702631081
1702631082
抽样误差
1702631083
1702631084
随机抽样误差是抽样误差的一种。误差范围可以告诉我们随机抽样误差的严重程度,而我们可以通过选择随机样本的大小,来控制随机抽样误差。另一个抽样误差的来源是使用了糟糕的抽样方法,比如自愿回应。糟糕的方法是可以避免的,但其他的抽样误差可就没那么好对付了。抽样之前必须先有一份“清单”,上面列出总体中的所有个体,以便我们从中抽取样本,我们称为“抽样框架”(sampling frame)。从理论上说,抽样框架应该包括总体当中的每一个个体。但是,总体的清单通常很难取得,所以大部分的样本都会存在涵盖不全的问题。
1702631085
1702631086
如果抽样框架原本就漏掉了某些群体,那么即使我们从中抽取随机样本,所得结果还是有偏的。比如,假设我们用电话黄页作为抽样框架进行电话调查,就会漏掉那些未登记的住户。在大城市里,超过一半的住户都没有登记电话号码,所以对于城市电话黄页来说,就会存在严重的涵盖不全和偏差问题。实际上,电话抽样调查用的是随机数字拨号设备,在指定区域内随机拨打电话。从效果上看,这个抽样框架包含了所有住户的电话号码。
1702631087
1702631088
1702631089
[
上一页 ]
[ :1.70263104e+09 ]
[
下一页 ]