打字猴:1.702639895e+09
1702639895 统计学的世界(第8版) [:1702629699]
1702639896 统计学的世界(第8版) 第23章 统计推断的滥用
1702639897
1702639898 案例分析
1702639899
1702639900 假设我们查看超过10000只面向大众投资者发行的共同基金,任何值得点击的投资网站都可以告诉你过去三年里收益最高的是哪些基金。2011年,一个网站声称ProFunds Internet Inv基金过去三年de收益位居前1%。如果在2008年买入这只基金,2011年我们的年收益率可以达到50.2%。与这段时间所有基金的平均收益相比,这只基金的收益明显更高。统计学显著性检验是否能证明这只基金是个好的投资标的呢?
1702639901
1702639902 在这一章,我们将深入了解统计推断和统计学显著性的意义,讨论一些统计推断的滥用情况。学完这一章,你将可以回答是否有很强的证据证明这只基金在2011年是一个非常好的投资标的。
1702639903
1702639904 聪明地做统计推断
1702639905
1702639906 我们已经知道“置信区间”和“显著性检验”这两种主要的统计推断方法,它们都是针对总体比例p和总体平均数μ所做的推断。你可以在许多书和软件当中,找到针对总体的各种参数做统计推断的方法。置信区间和显著性检验背后的理论基础也是一样的,只是细节看起来可能很吓人。聪明地做统计推断的第一步,是了解你的数据以及你想回答的问题,并寻找解决问题的适当方法。以下是统计推断的一些要点,以我们熟悉的形式呈现出来。
1702639907
1702639908 产生数据的设计很重要
1702639909
1702639910 “数据从哪里来”是所有统计研究应该问的第一个问题。任何推断方法都有特定的应用范围,以我们针对总体比例p所估算的置信区间和所进行的显著性检验来说:
1702639911
1702639912 • 数据必须是从我们关注的总体中抽取的简单随机样本。当你使用这些方法时,你其实是把数据当作简单随机样本在处理。由于实践中我们常常不可能真的从总体中抽取简单随机样本,所以你的结论可能会受到挑战。
1702639913
1702639914 • 这些方法对于诸如分层样本等比简单随机样本复杂的抽样设计来说,并不适用。对于复杂的设计来说,有别的方法可循。
1702639915
1702639916 • 对于随意搜集得到的而且偏差大小无法掌握的数据,没有正确的推断方法。再好的方法也拯救不了糟糕的数据。
1702639917
1702639918 • 其他误差来源,比如中途退出和无回应,也都很重要。要记住,置信区间和显著性检验只会根据你提供的数据得出结果,对于上述实际困难并不会考虑在内。
1702639919
1702639920 例1 心理学家和社会学家
1702639921
1702639922 一位心理学家对于人们的视觉认知会被幻觉所愚弄的现象感兴趣。她的实验对象是她所在大学里学习心理学基础课程的学生。大多数心理学家都同意,这些从视力正常的学生中选取的实验对象可被视为一个简单随机样本。对于学生来说,改变视觉认知并不是一件特别的事情。
1702639923
1702639924 同一所大学的一位社会学家以学习社会学基础课程的学生为调查对象,了解人们对待穷人和反贫困项目的态度。学生相比成年人是一个年轻群体,即便在年轻人中,大学生也是一个来自更富裕家庭和有更好教育背景的群体。在高校中,这所大学不是一所典型的学校,社会学专业的学生与工程学专业的学生也很可能有非常不同的看法。所以,这位社会学家不能理所当然地将这些学生当作其感兴趣的总体的一个随机样本。
1702639925
1702639926 了解置信区间的运作
1702639927
1702639928 置信区间可以估计未知的总体参数的值,同时告诉我们估计的不确定程度有多大。所有的置信区间都符合以下描述:
1702639929
1702639930 • 置信度告诉我们,同一个方法一再使用,其中会包含真实参数的比例。我们永远也不会知道,我们手上这组数据所得到的区间究竟有没有包含真实参数。我们只能说:“我得到这个结果,使用的是一种在95%的情况下会包含真实参数的方法。”所以,我们手上的数据有可能属于区间中未包含真实参数的那5%。如果你认为风险太大,不妨改用99%置信区间。
1702639931
1702639932 • 高置信度可不是平白得来的。根据同一组数据估算的99%置信区间会比95%置信区间宽。在估计真实参数的准确程度和对于包含真实参数的信心大小这两者之间,只能尽量寻求平衡。
1702639933
1702639934 • 样本变大,区间就会变窄。如果我们希望有高置信度,而且有较窄的区间,就必须取规模较大的样本。p的置信区间的长度,随样本大小的平方根成比例地减小。要把区间的长度缩为一半,观察值的数目就必须是原来的4倍。许多置信区间大致都是这个情况。
1702639935
1702639936 知识普及 中途退出
1702639937
1702639938 一项实验结果发现,要治疗高胆固醇和高血压,减肥明显比运动更有效。170位实验对象被随机分配到减肥组、运动组与控制组三者之一中。170人中只有111人完成了整个实验,统计分析就只用了这111人的数据。中途退出者是否造成了偏差?在相信实验结果之前,一定要先弄清楚有关数据的各种细节。
1702639939
1702639940 了解统计学显著性的意义
1702639941
1702639942 许多统计研究的目的,都是为了证明某种断言是正确的。临床试验将一种新药和标准用药做比较,因为医生希望新药对病人的帮助更大。研究性别差异的心理学家认为,在一项度量建立人际关系网络能力的测验中,女性的表现应该比男性好(平均来说)。显著性检验的目的是评估数据是否提供了足够证据,可以支持这类断言。也就是说,显著性检验可以帮助我们弄清楚,我们是否的确找到了想要找的东西。
1702639943
1702639944 要做到这一点,我们就必须知道,若断言不正确会发生什么状况。这指的是零假设:两种药效没差别,女性和男性没差别。显著性检验只回答一个问题:“零假设不正确的证据有多强?”显著性检验是用P值来回答这个问题的。P值告诉我们,如果零假设正确,数据几乎不可能得到。几乎不可能得到的数据,就是零假设不正确的合理证据。我们永远也不会知道,对我们的总体来说这假设是否为真。我们只能说:“如果零假设为真,这样的数据只有5%的时候会出现。”
[ 上一页 ]  [ :1.702639895e+09 ]  [ 下一页 ]