1702643990
1702643991
•有46%的美国人认可奥巴马作为美国总统的工作表现,同样有46%的美国人不认可奥巴马的工作表现。
1702643992
1702643993
•仅有9%的美国公众认可美国国会的工作。
1702643994
1702643995
•虽然距离下一次的美国总统初选只剩下不足两个月的时间,但是,还有将近80%的共和党选民觉得“现在就决定支持谁为时尚早”。
1702643996
1702643997
在美国总统选举年即将到来之际,这些引人入胜的数据可以为人们提供一些有意义的参考,让读者窥见美国人作为一个整体的所思所想。但是,总会有人忍不住要问:我们是如何知道这些情况的?美国的人口数以亿计,为什么我们就能对他们的想法做出如此精确的判断?我们怎么知道这些言之凿凿的判断是否正确?
1702643998
1702643999
答案当然是4个字:民意测验。上述例子的民意测验是由《纽约时报》和哥伦比亚广播公司(CBS)共同主导的(连两家彼此竞争的媒体都必须在某个民调项目上通力合作,可见要主导一个方法论上可行和完善的全美国性民调有多么“浪费资金”)。对于民意测验的结论,我想大家肯定不陌生;如果告诉大家民意测验的方法论其实是统计推断的另一种形式,大家会不会有一种恍然大悟的感觉?民意测验(或民调)就是基于从某个人口群体中所抽取的人口样本的观点所做出的推断。
1702644000
1702644001
民意测验的力量与前几章有关的样本案例如出一撤:中心极限定理。假如从美国选民(或其他任意的一个群体)中选取一个大型的代表性样本,那么我们完全可以合理地认为这个样本与其所在的群体具有相似性。假如正好有1/2的美国人不赞同同性婚姻,那么在一个数量为1000人的样本中,会有多少人不赞同同性婚姻呢?最佳猜测当然是500人。
1702644002
1702644003
一个更加符合民意测验的想法是将上面的例子反过来思考。如果我们有一个数量为1000人的样本,其中有46%的人不认可美国总统奥巴马的工作表现,那么我们就能从中推理出全体美国人对这个问题的态度。事实上,我们还可以计算出样本结果大面积偏离整体的概率。如果你在一个民调结果里看到“误差幅度为±3%”的字眼,其实就跟我们在上一章所讲的“置信区间为95%”是一个道理。95%的置信区间意味着假如从同一个群体中重复进行100次不同的抽样,我们可以预测其中有95次测验结果会位于该群体真实感受±3%的范围。在《纽约时报》和CBS的民意测验中,有关工作表现的问题,我们有95%的把握认为所有美国人中不赞同美国总统奥巴马工作表现的比例会在46%±3%的范围内,即介于43%~49%。如果你在读报时看得仔细,会发现这篇报道的下方有一行小字(我强烈建议大家去读一读)是这样写的:“理论上说,民意测验结果有95%的概率在实际情况(即采访所有美国成年人所得出的结论)±3%的范围内浮动。”
1702644004
1702644005
民意调查和其他形式的抽样之间最根本的区别就在于,我们所关心的前者的样本数据不是平均数(如187磅),而是一个百分比(如47%的选民、0.47等)。除此以外在其他方面,两者的流程是类似的。当我们掌握了一个数量巨大、具有代表性的样本(民意样本)之后,我们便可以预测样本里持某种观点的人数比例(如9%的人认为美国国会在管理国家事务中发挥了良好的作用),约等于所有持该观点的美国人占美国总人口的比例。这与认为一个包含1000名美国男性样本的平均体重约等于所有美国男性的平均体重并无二异。但是,不同的样本对于美国国会工作的认可程度表现在百分比方面还是会有所不同,这和不同的随机样本中1000个男性的平均体重也会稍许差别是一样的。如果《纽约时报》和CBS进行第二次民意测验,也就是对另外1000名美国成年人提出同样的问题,那么第二次的民调结果与第一次的结果完全相同的概率非常低。但与此同时,我们也不应该指望第二次民调结果与第一次的结果大相径庭。用一个比喻形容,就是你舀了一勺汤尝了尝,然后用汤勺搅动了一下汤锅,之后再舀一勺汤,这两勺汤的味道应该是差不多的。标准误差所要传达的就是不同样本平均值和不同民调结果的离散程度。
1702644006
1702644007
1702644008
百分比的标准误差计算公式与之前介绍的有细微差别,但其中的原理是一样的。对于任意一个随机抽取的样本而言,标准误差等于,其中p代表某个特定观点的回应者比例,(1-P)代表不同观点的回应者比例,n为样本中所有回应者的数量。而且由于n处于分母的位置,因此样本量越大,标准误差越小。而且当P与(1-P)的差距越来越大时,标准误差也会变得越来越小。举例来说,当有95%的回应者表达相同的观点时,其样本的标准误差就会小于回应者观点只有50%的相同率的样本的标准误差。这就是纯数学,0.05x0.95=0.047,0.5x0.5=0.25,分子的数字越小,计算得到的标准误差也越小。
1702644009
1702644010
1702644011
1702644012
举个简单的例子,假设在一次“选举后测验”中,在选举当天投出选票的500位选民里有53%投给了美国共和党候选人,45%投给了美国民主党,还有2%投给了第三方的候选人。如果以美国共和党的支持率作为参照,那么这次“选举后测试”的标准误差就是。
1702644013
1702644014
为了方便起见,我们将这次的“选举后测试”的标准误差约等于0.02。到现在为止,这只是一个数字,要怎样才能赋予0.02这个数字更多的意义呢?假如这次民意测验刚刚结束,在一家电视台工作的你就急于在最终结果出来之前向全美国观众率先宣布这场比赛的赢家是谁。你现在已经算得上是一名“半专业”的数据分析师了(因为你已经读完了本书2/3的内容),节目制片人向你咨询:我们能否以这次“选举后测试”的结果作为宣布共和党获胜的依据?
1702644015
1702644016
你解释说,这要看你在这条选情预测新闻里的“置信区间”有多少了。更具体地说,你愿意为播出内容的错误承担多大的风险?需要记住,标准误差为样本比例(“选举后测试”)是否接近于现实中的人口比例(选举结果)提供了理性的概率参考。我们已知的是,样本比例约有68%的概率落在最终结果一个标准误差的范围内(在这个例子中指的是共和党53%的选民支持率),因此,你可以告诉你的制片人,你有68%的把握认为共和党会获得53%±2%的支持率,也就是51%〜55%。与此同时,“选举后测试”显示民主党候选人获得了45%的选票,假设民主党的支持率有相同的标准误差(至于为什么可以这样简化,我等一下会向大家解释),那么我们也可以有68%的把握声称,民主党会获得45%±2%(43%~47%)的支持率。根据这一计算,我们的结论是共和党会在选举中获胜。
1702644017
1702644018
图文组的同事会在第一时间制作出一张适合于电视播放的立体统计图,这样你就可以显示在荧屏上给观众演示了。这张统计图里肯定会包含以下信息:
1702644019
1702644020
共和党53%
1702644021
1702644022
民主党45%
1702644023
1702644024
独立党派2%
1702644025
1702644026
(误差幅度±2%)
1702644027
1702644028
首先,你的制片人面对这样的一个结果肯定会印象深刻并且兴奋不已,很大程度上是因为上面的这张统计图竟然是彩色3D版的,而且还能在屏幕上进行360°旋转。但是,当你向她解释道,“选举后测试”的结果约有68%的概率落在真实情况一个标准误差的范围内时,这位两次被法庭强制要求参加愤怒管理课程的制片人在脑子里迅速作了一个减法:那剩下的32%是什么情况?
1702644029
1702644030
接下来,你解释说会有两种可能:(1)共和党的支持率比民调结果更高,在这种情况下我们的预测依旧是正确的;(2)也有一定的可能性是民主党获得了比民调高得多的支持率,如果是这种情况,就意味着之前彩色的、可以旋转的3D图错误地预测了选举的获胜方。
1702644031
1702644032
制片人听完后一言不发,随手将桌上的一个咖啡杯扔了出去,杯子在空中划出了一条完美的弧线,并最终落在了房间的另一端,摔得粉碎。接着,她大声呵斥道:“我们怎么才能保证播出的是一个正确的结果?”
1702644033
1702644034
作为统计学专家,你指出,除非将所有选票都清点出来,否则没有人能够准确无误地预测选举结果。但你还是将置信区间扩大到了95%,在这种情况下,那张3D统计图出错的概率就降到了5%。
1702644035
1702644036
制片人点上了一支烟,看上去比刚才放松了一些。你决定还是不提醒她办公场所禁止抽烟的规定,因为上一次就是因为这句善意的提醒而引发了一场灾难。但是,有一些坏消息是不得不说的。电视台在播出新闻时如果要让自己的可信度提升,就必须扩大“误差幅度”,一旦这样做了,就意味着选举结果中不再有一个清晰的赢家了。你将新制作好的统计图拿给你的制片人看:
1702644037
1702644038
共和党53%
1702644039
[
上一页 ]
[ :1.70264399e+09 ]
[
下一页 ]