1702631031
(a)有位美国国会议员认为95%置信度还不够,他希望达到99%的置信度。对同一个样本来说,99%置信度下的误差范围和95%置信度下的误差范围,有何差别?
1702631032
1702631033
(b)另一位国会议员觉得95%置信度已经足够好了,但她想要更小的误差范围。我们怎样做才可以维持95%的置信度,并且得到较小的误差范围?
1702631034
1702631035
3.31 失业率。虽然民意调查通常的置信度都是95%,但也有抽样调查采用其他的置信度。举例来说,美国的每月失业率是根据当前人口调查走访的约60000个住户得来的。随着失业率一起公布的误差范围,大约是±0.2%,置信度为90%。相较之下,95%置信度下的误差范围会更小还是更大?为什么?
1702631036
1702631037
3.32 华尔街人士。2011年4月,一项哈里斯调查访谈了一个包含1010位美国成年人的随机样本,问他们是否同意以下说法:“大部分华尔街人士在认为自己能赚到钱的同时也能逃脱惩罚时,愿意去违法。”结果表明有677人对此表示赞同。请你对这项调查结果写一个简短的报告,不要忘了说明误差范围。注意,别把个人意见与统计结果混淆在一起。
1702631038
1702631039
3.33 该向谁问责?2009年2月由纽约州波基普西的玛利斯特学院公众意见研究所做的一项民意调查,访谈了包含2071位美国成年人的一个随机样本,问他们“谁或者什么应为公司的成功或失败负责”。调查对象中有70%的人将公司的成败归因于高层管理人员的决策。该项调查又向110名公司管理人员问了同样的问题,其中有88%的人认为最高管理层应为公司的成败负责。
1702631040
1702631041
玛利斯特学院报告说,其中一项抽样调查的误差范围是±9%,而另一个是±2.5%。你认为哪个抽样调查的误差范围是±9%,为什么?
1702631042
1702631043
3.34 模拟(Simulation)。随机数字可被用来模拟随机抽样的结果。假设你要从一个包含许多名大学生的总体里面,抽取一个大小为25的简单随机样本,总体当中有20%的学生在暑假期间没工作。要用随机数字模拟这个简单随机样本的话,我们可以用从表A当中任一处开始的连续25个数字,来代表我们抽取的样本中的学生。用0和1这两个数字代表没工作的学生,其他数字代表有工作的学生。这样的设计是对我们的简单随机样本的一个正确的模拟,因为0和1这两个数字在所有10个被选中的概率相同的数字当中占20%。
1702631044
1702631045
按照以下步骤来模拟50个随机样本的结果,将表A中共50行中的每一行的前25个数字当作一个样本,数一数每个样本当中0和1共有几个。把50个样本的结果,用像图3–1那样的柱状图展示出来。总体参数的真实值(也就是未工作学生的比例,即20%),是不是几乎位于你的柱状图的中间位置?在你的50个样本当中,未工作的学生人数最大是多少,最小是多少?在你的样本里面,有4、5或6个学生没工作的样本数量,占50个样本的百分比是多少?
1702631046
1702631047
3.35 网上练习。浏览www.gallup.com并阅读首页文章。点击More按钮,这篇文章会告诉你在95%置信度下误差范围是多大?
1702631048
1702631049
3.36 网上练习。点击http://media.gallup.com/PDF/FAQ/HowArePolls.pdf,这篇文章给出了盖洛普公司对于为何小样本可以给出关于大总体的可靠结论的解释。这篇文章是怎样解释95%置信度的?
1702631050
1702631051
1702631052
1702631053
1702631055
统计学的世界(第8版) 第4章 真实世界中的抽样调查
1702631056
1702631057
案例分析
1702631058
1702631059
某项民意调查访问了随机抽样的1000个人后,公布了调查结果,其中包括误差范围。我们对此是不是应该满足了呢?恐怕不行,因为有许多调查并没有把和样本相关的信息全部告诉我们。皮尤研究中心(Pew Research Center)效仿几家较好的民意调查机构的做法,然后把调查过程的细节详述如下。
1702631060
1702631061
大部分民意调查是利用电话进行的,用随机拨号的方式取得所有住户的一个随机样本。在剔除传真号码和公司的办公电话之后,皮尤必须拨打2879个住宅电话,才能得到一个1000人的样本。这2879个电话可以分成以下几种情况。
1702631062
1702631063
1702631064
1702631065
1702631066
在2879个有效的住宅电话当中,有33%的电话无人接听。在接听电话的人里面,有35%的人不愿接受访问。无回应(nonresponse)的人(包括不接听电话、不愿接受访谈、未完成访谈的人)为1658人,占2879人的58%。皮尤在5天里,选一个星期中的不同日子和每天的不同时段,每个号码都拨打5次。其他很多调查一般只拨打一次电话,而且在接听电话的人当中,常常有超过一半人不愿接受访问。尽管皮尤研究中心成功地访谈了1000人,我们可以信任这个调查结果吗?学完本章,你就会知道这个问题的答案。
1702631067
1702631068
抽样误差
1702631069
1702631070
随机抽样方法在选取样本时可以消除偏差,也可以控制变异性的大小。那么,是不是只要我们看到“随机抽样”和“误差范围”这两个关键词时,就可以信任调查结果了呢?它当然好于自愿回应的调查方法,但是否像我们期望的那么好,就不一定了。在真实世界里抽样,比起从教科书练习里的名单当中抽一个简单随机样本要复杂得多,结果也较不可靠。置信度说明并不能把真实抽样的所有误差来源都反映出来。
1702631071
1702631072
抽样中发生的误差
1702631073
1702631074
抽样误差(sampling error)是抽样所造成的误差。抽样误差使得样本结果和普查结果不同。
1702631075
1702631076
随机抽样误差(random sampling error)是样本统计量和总体参数之间的差距,是在选取样本时由随机性造成的。置信度说明中的误差范围指的是随机抽样误差。
1702631077
1702631078
非抽样误差(nonsampling error)是和“从总体中抽取样本”这个做法无关的误差。非抽样误差即使在人口普查中也有可能出现。
1702631079
1702631080
大部分的抽样调查都会遇到随机抽样误差以外的误差。这些误差可能导致偏差的产生,使得置信度说明失去意义。好的抽样方法中包含减少各种误差来源的技术。这种技术有一部分是统计科学,因为随机样本与置信度说明都属于统计科学的范畴。然而在实际应用中,要得到好的样本,光靠好的统计方法是不够的。我们来看看抽样调查有些什么样的误差来源,以及调查人员该如何解决。
[
上一页 ]
[ :1.702631031e+09 ]
[
下一页 ]