打字猴:1.70264396e+09

1702643960 现在，我们再来考虑另一个备择假设——男性篮球运动员高于或低于普通男性。我们所用的检验的方法大体是一样的。如果两类人的平均身高的确是相同的（零假设），那么当两个样本的平均值之差大于或等于1.64SE的概率只有不到5%时，我们就可以推翻零假设。本题中的“差”还包括篮球运动员比普通人矮的情况，也就是说，如果运动员样本的平均身高与普通人相比差距较大，我们就可以推翻零假设。这就需要我们进行双尾假设检验。现在，需要考虑的推翻零假设的区间存在两个：正方向和负方向。具体来说，推翻零假设的范围现在被一分为二，在坐标轴上分成了左右两条“尾巴”。只要我们得到的结果小于或等于5%的概率，就可以宣告零假设不成立，只不过我们现在有两种情况都可以推翻“球员的平均身高等于普通男性身高”的零假设。

1702643961

1702643962 先考虑运动员的平均身高大于普通男性的情况，在计算出运动员高于普I通人的差值之后，只有当该差值的出现概率小于或等于2.5%时，零假设才可以被推翻。

1702643963

1702643964 再考虑运动员的平均身高小于普通男性的情况，在计算出运动员低于普通人的差值之后，只有当该差值的出现概率小于或等于2.5%时，零假设才可以被推翻。

1702643965

1702643966 这两种情况的概率之和为5%,如下图所示。

1702643967

1702643968

1702643969

1702643970

1702643971 图10-4样本平均值的差异（以标准误差为参照）

1702643972

1702643973 这个例子是用单尾假设检验还是双尾假设检验更为适合呢？我想，大家的心中一定有答案了吧。

1702643974

1702643975

1702643976

1702643977

1702643978 赤裸裸的统计学：除去大数据的枯燥外衣，呈现真实的数字之美 [:1702642311]

1702643979 赤裸裸的统计学：除去大数据的枯燥外衣，呈现真实的数字之美第11章民意测验与误差幅度

1702643980

1702643981 民调结果显示，有89%的美国人不相信政府会做正确的事,有46%的美国人认可奥巴马的工作表现。这个结杲可以代表美国人的真实想法吗？

1702643982

1702643983 2011年下半年，《纽约时报》头版报道了“美国全国陷入了对未来的深深忧虑和怀疑中”，作者对美国人的心理进行了探究，整理了美国公众对于奥巴马政府的表现、社会财富分配等众多问题的普遍看法。下面，我们就来了解一下2011年秋天美国人想要表达的想法：

1702643984

1702643985 •有高达89%的美国人不相信政府会做正确的事——美国政府遭遇了有记录以来最严峻的一次信任危机。

1702643986

1702643987 •有2/3的美国公众认为，财富应该在美国得到更加公平的分配。

1702643988

1702643989 •有43%的美国人说他们大体上认同“占领华尔街”运动所宣扬的观点（“占领华尔街”是一场发籾于纽约华尔街并迅速波及全美和其他国家的自发性抗议活动）。此外，还有更多的美国人（46%）认为“占领华尔街”运动中抗议人群的观点“基本上反映了绝大多数美国人的观点”。

1702643990

1702643991 •有46%的美国人认可奥巴马作为美国总统的工作表现，同样有46%的美国人不认可奥巴马的工作表现。

1702643992

1702643993 •仅有9%的美国公众认可美国国会的工作。

1702643994

1702643995 •虽然距离下一次的美国总统初选只剩下不足两个月的时间，但是，还有将近80%的共和党选民觉得“现在就决定支持谁为时尚早”。

1702643996

1702643997 在美国总统选举年即将到来之际，这些引人入胜的数据可以为人们提供一些有意义的参考，让读者窥见美国人作为一个整体的所思所想。但是，总会有人忍不住要问：我们是如何知道这些情况的？美国的人口数以亿计，为什么我们就能对他们的想法做出如此精确的判断？我们怎么知道这些言之凿凿的判断是否正确？

1702643998

1702643999 答案当然是4个字：民意测验。上述例子的民意测验是由《纽约时报》和哥伦比亚广播公司（CBS）共同主导的（连两家彼此竞争的媒体都必须在某个民调项目上通力合作，可见要主导一个方法论上可行和完善的全美国性民调有多么“浪费资金”）。对于民意测验的结论，我想大家肯定不陌生；如果告诉大家民意测验的方法论其实是统计推断的另一种形式，大家会不会有一种恍然大悟的感觉？民意测验（或民调）就是基于从某个人口群体中所抽取的人口样本的观点所做出的推断。

1702644000

1702644001 民意测验的力量与前几章有关的样本案例如出一撤：中心极限定理。假如从美国选民（或其他任意的一个群体）中选取一个大型的代表性样本，那么我们完全可以合理地认为这个样本与其所在的群体具有相似性。假如正好有1/2的美国人不赞同同性婚姻，那么在一个数量为1000人的样本中，会有多少人不赞同同性婚姻呢？最佳猜测当然是500人。

1702644002

1702644003 一个更加符合民意测验的想法是将上面的例子反过来思考。如果我们有一个数量为1000人的样本，其中有46%的人不认可美国总统奥巴马的工作表现，那么我们就能从中推理出全体美国人对这个问题的态度。事实上，我们还可以计算出样本结果大面积偏离整体的概率。如果你在一个民调结果里看到“误差幅度为±3%”的字眼，其实就跟我们在上一章所讲的“置信区间为95%”是一个道理。95%的置信区间意味着假如从同一个群体中重复进行100次不同的抽样，我们可以预测其中有95次测验结果会位于该群体真实感受±3%的范围。在《纽约时报》和CBS的民意测验中，有关工作表现的问题，我们有95%的把握认为所有美国人中不赞同美国总统奥巴马工作表现的比例会在46%±3%的范围内，即介于43%~49%。如果你在读报时看得仔细，会发现这篇报道的下方有一行小字（我强烈建议大家去读一读）是这样写的：“理论上说，民意测验结果有95%的概率在实际情况（即采访所有美国成年人所得出的结论）±3%的范围内浮动。”

1702644004

1702644005 民意调查和其他形式的抽样之间最根本的区别就在于，我们所关心的前者的样本数据不是平均数（如187磅），而是一个百分比（如47%的选民、0.47等）。除此以外在其他方面，两者的流程是类似的。当我们掌握了一个数量巨大、具有代表性的样本（民意样本）之后，我们便可以预测样本里持某种观点的人数比例（如9%的人认为美国国会在管理国家事务中发挥了良好的作用），约等于所有持该观点的美国人占美国总人口的比例。这与认为一个包含1000名美国男性样本的平均体重约等于所有美国男性的平均体重并无二异。但是，不同的样本对于美国国会工作的认可程度表现在百分比方面还是会有所不同，这和不同的随机样本中1000个男性的平均体重也会稍许差别是一样的。如果《纽约时报》和CBS进行第二次民意测验，也就是对另外1000名美国成年人提出同样的问题，那么第二次的民调结果与第一次的结果完全相同的概率非常低。但与此同时，我们也不应该指望第二次民调结果与第一次的结果大相径庭。用一个比喻形容，就是你舀了一勺汤尝了尝，然后用汤勺搅动了一下汤锅，之后再舀一勺汤，这两勺汤的味道应该是差不多的。标准误差所要传达的就是不同样本平均值和不同民调结果的离散程度。

1702644006

1702644007

1702644008 百分比的标准误差计算公式与之前介绍的有细微差别，但其中的原理是一样的。对于任意一个随机抽取的样本而言，标准误差等于，其中p代表某个特定观点的回应者比例，（1-P）代表不同观点的回应者比例，n为样本中所有回应者的数量。而且由于n处于分母的位置，因此样本量越大，标准误差越小。而且当P与（1-P）的差距越来越大时，标准误差也会变得越来越小。举例来说，当有95%的回应者表达相同的观点时，其样本的标准误差就会小于回应者观点只有50%的相同率的样本的标准误差。这就是纯数学，0.05x0.95=0.047，0.5x0.5=0.25，分子的数字越小，计算得到的标准误差也越小。

1702644009

[ 上一页 ] [ :1.70264396e+09 ] [ 下一页 ]