1702643979
赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 第11章 民意测验与误差幅度
1702643980
1702643981
民调结果显示,有89%的美国人不相信政府会做正确的事,有46%的美国人认可奥巴马的工作表现。这个结杲可以代表美国人的真实想法吗?
1702643982
1702643983
2011年下半年,《纽约时报》头版报道了“美国全国陷入了对未来的深深忧虑和怀疑中”,作者对美国人的心理进行了探究,整理了美国公众对于奥巴马政府的表现、社会财富分配等众多问题的普遍看法。下面,我们就来了解一下2011年秋天美国人想要表达的想法:
1702643984
1702643985
•有高达89%的美国人不相信政府会做正确的事——美国政府遭遇了有记录以来最严峻的一次信任危机。
1702643986
1702643987
•有2/3的美国公众认为,财富应该在美国得到更加公平的分配。
1702643988
1702643989
•有43%的美国人说他们大体上认同“占领华尔街”运动所宣扬的观点(“占领华尔街”是一场发籾于纽约华尔街并迅速波及全美和其他国家的自发性抗议活动)。此外,还有更多的美国人(46%)认为“占领华尔街”运动中抗议人群的观点“基本上反映了绝大多数美国人的观点”。
1702643990
1702643991
•有46%的美国人认可奥巴马作为美国总统的工作表现,同样有46%的美国人不认可奥巴马的工作表现。
1702643992
1702643993
•仅有9%的美国公众认可美国国会的工作。
1702643994
1702643995
•虽然距离下一次的美国总统初选只剩下不足两个月的时间,但是,还有将近80%的共和党选民觉得“现在就决定支持谁为时尚早”。
1702643996
1702643997
在美国总统选举年即将到来之际,这些引人入胜的数据可以为人们提供一些有意义的参考,让读者窥见美国人作为一个整体的所思所想。但是,总会有人忍不住要问:我们是如何知道这些情况的?美国的人口数以亿计,为什么我们就能对他们的想法做出如此精确的判断?我们怎么知道这些言之凿凿的判断是否正确?
1702643998
1702643999
答案当然是4个字:民意测验。上述例子的民意测验是由《纽约时报》和哥伦比亚广播公司(CBS)共同主导的(连两家彼此竞争的媒体都必须在某个民调项目上通力合作,可见要主导一个方法论上可行和完善的全美国性民调有多么“浪费资金”)。对于民意测验的结论,我想大家肯定不陌生;如果告诉大家民意测验的方法论其实是统计推断的另一种形式,大家会不会有一种恍然大悟的感觉?民意测验(或民调)就是基于从某个人口群体中所抽取的人口样本的观点所做出的推断。
1702644000
1702644001
民意测验的力量与前几章有关的样本案例如出一撤:中心极限定理。假如从美国选民(或其他任意的一个群体)中选取一个大型的代表性样本,那么我们完全可以合理地认为这个样本与其所在的群体具有相似性。假如正好有1/2的美国人不赞同同性婚姻,那么在一个数量为1000人的样本中,会有多少人不赞同同性婚姻呢?最佳猜测当然是500人。
1702644002
1702644003
一个更加符合民意测验的想法是将上面的例子反过来思考。如果我们有一个数量为1000人的样本,其中有46%的人不认可美国总统奥巴马的工作表现,那么我们就能从中推理出全体美国人对这个问题的态度。事实上,我们还可以计算出样本结果大面积偏离整体的概率。如果你在一个民调结果里看到“误差幅度为±3%”的字眼,其实就跟我们在上一章所讲的“置信区间为95%”是一个道理。95%的置信区间意味着假如从同一个群体中重复进行100次不同的抽样,我们可以预测其中有95次测验结果会位于该群体真实感受±3%的范围。在《纽约时报》和CBS的民意测验中,有关工作表现的问题,我们有95%的把握认为所有美国人中不赞同美国总统奥巴马工作表现的比例会在46%±3%的范围内,即介于43%~49%。如果你在读报时看得仔细,会发现这篇报道的下方有一行小字(我强烈建议大家去读一读)是这样写的:“理论上说,民意测验结果有95%的概率在实际情况(即采访所有美国成年人所得出的结论)±3%的范围内浮动。”
1702644004
1702644005
民意调查和其他形式的抽样之间最根本的区别就在于,我们所关心的前者的样本数据不是平均数(如187磅),而是一个百分比(如47%的选民、0.47等)。除此以外在其他方面,两者的流程是类似的。当我们掌握了一个数量巨大、具有代表性的样本(民意样本)之后,我们便可以预测样本里持某种观点的人数比例(如9%的人认为美国国会在管理国家事务中发挥了良好的作用),约等于所有持该观点的美国人占美国总人口的比例。这与认为一个包含1000名美国男性样本的平均体重约等于所有美国男性的平均体重并无二异。但是,不同的样本对于美国国会工作的认可程度表现在百分比方面还是会有所不同,这和不同的随机样本中1000个男性的平均体重也会稍许差别是一样的。如果《纽约时报》和CBS进行第二次民意测验,也就是对另外1000名美国成年人提出同样的问题,那么第二次的民调结果与第一次的结果完全相同的概率非常低。但与此同时,我们也不应该指望第二次民调结果与第一次的结果大相径庭。用一个比喻形容,就是你舀了一勺汤尝了尝,然后用汤勺搅动了一下汤锅,之后再舀一勺汤,这两勺汤的味道应该是差不多的。标准误差所要传达的就是不同样本平均值和不同民调结果的离散程度。
1702644006
1702644007
1702644008
百分比的标准误差计算公式与之前介绍的有细微差别,但其中的原理是一样的。对于任意一个随机抽取的样本而言,标准误差等于,其中p代表某个特定观点的回应者比例,(1-P)代表不同观点的回应者比例,n为样本中所有回应者的数量。而且由于n处于分母的位置,因此样本量越大,标准误差越小。而且当P与(1-P)的差距越来越大时,标准误差也会变得越来越小。举例来说,当有95%的回应者表达相同的观点时,其样本的标准误差就会小于回应者观点只有50%的相同率的样本的标准误差。这就是纯数学,0.05x0.95=0.047,0.5x0.5=0.25,分子的数字越小,计算得到的标准误差也越小。
1702644009
1702644010
1702644011
1702644012
举个简单的例子,假设在一次“选举后测验”中,在选举当天投出选票的500位选民里有53%投给了美国共和党候选人,45%投给了美国民主党,还有2%投给了第三方的候选人。如果以美国共和党的支持率作为参照,那么这次“选举后测试”的标准误差就是。
1702644013
1702644014
为了方便起见,我们将这次的“选举后测试”的标准误差约等于0.02。到现在为止,这只是一个数字,要怎样才能赋予0.02这个数字更多的意义呢?假如这次民意测验刚刚结束,在一家电视台工作的你就急于在最终结果出来之前向全美国观众率先宣布这场比赛的赢家是谁。你现在已经算得上是一名“半专业”的数据分析师了(因为你已经读完了本书2/3的内容),节目制片人向你咨询:我们能否以这次“选举后测试”的结果作为宣布共和党获胜的依据?
1702644015
1702644016
你解释说,这要看你在这条选情预测新闻里的“置信区间”有多少了。更具体地说,你愿意为播出内容的错误承担多大的风险?需要记住,标准误差为样本比例(“选举后测试”)是否接近于现实中的人口比例(选举结果)提供了理性的概率参考。我们已知的是,样本比例约有68%的概率落在最终结果一个标准误差的范围内(在这个例子中指的是共和党53%的选民支持率),因此,你可以告诉你的制片人,你有68%的把握认为共和党会获得53%±2%的支持率,也就是51%〜55%。与此同时,“选举后测试”显示民主党候选人获得了45%的选票,假设民主党的支持率有相同的标准误差(至于为什么可以这样简化,我等一下会向大家解释),那么我们也可以有68%的把握声称,民主党会获得45%±2%(43%~47%)的支持率。根据这一计算,我们的结论是共和党会在选举中获胜。
1702644017
1702644018
图文组的同事会在第一时间制作出一张适合于电视播放的立体统计图,这样你就可以显示在荧屏上给观众演示了。这张统计图里肯定会包含以下信息:
1702644019
1702644020
共和党53%
1702644021
1702644022
民主党45%
1702644023
1702644024
独立党派2%
1702644025
1702644026
(误差幅度±2%)
1702644027
[
上一页 ]
[ :1.702643978e+09 ]
[
下一页 ]