1702640907
IV.28 辛普森悖论。如果我们比较2003年全美教育成果评估的数学平均分,就会发现内布拉斯加州的八年级学生的成绩比纽约州的八年级学生好。但是,如果我们只看白人学生的成绩,却是纽约州更好;如果我们只看少数族裔的成绩,也是纽约州更好。这就是辛普森悖论:当我们把两组学生整合起来考虑时,会得到相反的结论。利用内布拉斯加州八年级学生中白人比例高得多的这个事实,详细说明为什么这种结果并不奇怪。
1702640908
1702640909
IV.29 不满意的HMO病人。一项关于HMO会员的研究,对提出医疗申诉的会员、提出非医疗申诉的会员与未提出申诉会员的简单随机样本做了比较。以下是每组中留下的人数与自动退出HMO的人数。
1702640910
1702640911
1702640912
1702640913
1702640914
(a)算出行总数与列总数。
1702640915
1702640916
(b)算出每组的退出比例。
1702640917
1702640918
(c)算出预期计数,并确认是否符合使用卡方检验的条件。
1702640919
1702640920
(d)双向表的卡方统计量χ2=31.765。这个统计检验的零假设和备择假设各是什么?自由度是多少?统计学显著性如何?对于申诉状况和退出HMO之间的关系,你会得出什么结论?
1702640921
1702640922
IV.30 治疗胃溃疡。胃冷冻一度是胃溃疡的标准疗法,在实验证明胃冷冻并无疗效之后,这种疗法就停用了。有一项随机比较实验的结果是,采用胃冷冻疗法的82个病人中有28人的症状有所改善,而安慰剂组的78个病人中有30人的症状有所改善。
1702640923
1702640924
(a)用图描述此实验的设计。
1702640925
1702640926
(b)制作一个疗法与结果(实验对象的症状是否有所改善)的双向表。疗法和结果之间存在具有统计学显著性的相关关系吗?
1702640927
1702640928
(c)做一个简短的总结,内容要包括检验结果和用来比较两种疗法有效程度的百分比。
1702640929
1702640930
IV.31 什么时候做电话调查比较好?从练习IV.11中我们得知,有一项调查在两个不同时段随机给人们拨打电话。在工作日上午拨打的2304个电话中,1313个有人接听。在工作日晚上拨打的2454个电话中,1840个有人接听。
1702640931
1702640932
(a)制作一个致电时段与电话是否有人接听的双向表。在两个时段中,有人接听电话的百分比各是多少?
1702640933
1702640934
(b)我们应该可以看出,在致电时段和电话是否有人接听之间存在具有统计学显著性的相关关系,为什么?
1702640935
1702640936
(c)虽然结果很明显,但还是要做卡方检验。你的结论是什么?
1702640937
1702640938
报告作业
1702640939
1702640940
报告作业是比较复杂的练习,需要搜集信息或分析数据,而且重点是要把得出的结果用一篇短文来说明。这里有很多题目适合由一组学生共同完成。
1702640941
1702640942
作业1:为医学研究做新闻报道。医学期刊中的许多主要文章都和经过统计设计的研究有关,并报告统计推断的结果,通常是P值或95%置信区间。你可以在《美国医学协会期刊》的网站(网址:jama.ama-assn.org)或《新英格兰医学期刊》的网站(网址:www.nejm.org)上找到当期文章的摘要。要看整篇文章可能需要付费,或者去图书馆。从中选择一篇讲述医学实验的文章,实验主题需要是没受过医学训练的人也能看懂的。比如,第21章和第22章中举过的例子:易怒程度和患心脏病的关系,以及高纤维食物是否可以降低胆固醇水平等。写一篇两段式的新闻报道,介绍其研究结果。
1702640943
1702640944
然后写一段简短的文字,说明你怎样决定报道中写些什么和不写什么。比如,如果你省略了有关统计学显著性或者置信区间的细节,要说明理由。关于研究的设计你说了什么,为什么这么说?写新闻报道的人经常要做这类决定。
1702640945
1702640946
作业2:统计推断的滥用。有关复杂统计方法的说明,未经过专业训练几乎不可能读懂。“伯特的真正错误”是古尔德在1981年出版的《人的错误测量》(The Mismeasure of Man)一书中的一章,它也是滥用统计推断的典型例子。古尔德指出,伯特等人专门利用复杂的统计方法去“发现”一些令人怀疑的形态。把“伯特的真正错误”这一章读一读,并写一段简短的说明,解释为什么“因子分析”(factor analysis)无法对心智能力的结构提供明确的信息。
1702640947
1702640948
作业3:自己做一项统计研究。找两个类别变量,它们之间的相关关系是你感兴趣的,然后去搜集相关数据。一个简单的例子是学生的性别与他们的政治倾向,复杂一点儿的例子是大学生的年级和他毕业后的计划(马上就业、继续念书、休息一阵子……)。我们不要求你必须用真正的简单随机样本。
1702640949
1702640950
搜集数据并制作一个双向表,然后做分析,包括通过比较百分比来描述两个变量之间的相关关系,用卡方统计量评估其统计学显著性。描述你的研究,以及你的发现。你的样本会不会太小了,以至于样本结果不具有统计学显著性也不奇怪?
1702640951
1702640952
作业4:汽车的颜色。我听说白色汽车的销量比其他颜色的汽车都多。你所在大学的学生驾驶的汽车中有多少百分比是白色的?搜集数据并给出一个白色汽车所占比例的置信区间来回答这个问题。你可以抽取一个学生样本,通过问他们问题来搜集数据,也可以到学生停车场去观察汽车的颜色。在你的讨论中,要说明你做了何种努力,去得到接近于学生驾驶汽车总体的简单随机样本。
1702640953
1702640954
1702640955
1702640956
[
上一页 ]
[ :1.702640907e+09 ]
[
下一页 ]