打字猴:1.704436003e+09
1704436003 信号与噪声:大数据时代预测的科学与艺术 [:1704435321]
1704436004 信号与噪声:大数据时代预测的科学与艺术 第二章 政治选举预测:狐狸和刺猬,谁更聪明?
1704436005
1704436006
1704436007
1704436008 对许多人来说,政治预测就是“麦克劳夫伦讨论小组”这档电视节目的同义词。从1982年开始,每周日电视台都会播出这样一场“政治圆桌会议”,之后还会被“周六夜现场”节目恶搞一番。节目主持人约翰·麦克劳夫伦是一个80多岁的暴脾气老人,曾在1970年竞选美国参议员时落败。该节目像组织体育活动一样组织政治专家展开讨论,小组成员要在半个小时内循环讨论四五个话题,麦克劳夫伦会就相关话题对这些成员步步紧逼,这些话题从澳大利亚政治探讨到地外智慧生物探寻,无所不包。
1704436009
1704436010 “麦克劳夫伦讨论小组”每期节目的最后都设有一个“预测”的环节,在这个环节中,小组成员用几秒钟的时间讨论当天发生的某件事的重要性。有时,他们可以选择一个和政治关系不大的话题进行预测;有时,麦克劳夫伦会就某一个特定问题突击询问小组成员,让他们现场作答,麦克劳夫伦称此为“强迫性预测”。
1704436011
1704436012 麦克劳夫伦的有些问题很难回答,比如让小组成员从几个最佳候选人中选出最高法院的下届法官。其他问题则比较温和,比如2008年美国总统大选前夕,他曾让小组成员预测麦凯恩和奥巴马谁会当选。
1704436013
1704436014 答案显而易见。2008年9月15日,雷曼兄弟宣布破产,引发了自20世纪30年代大萧条时期之后最严重的经济衰退,正是从那天起,奥巴马的选票数几乎在所有的美国投票站都领先麦凯恩。而且,不论是在俄亥俄州、佛罗里达州、宾夕法尼亚州或是新罕布什尔州这样的“摇摆”州,还是在一些民主党很少获胜的地区,如科罗拉多州和弗吉尼亚州,奥巴马也都处于领先地位。我为自己的网站开发的预测模式和其他类似的统计模式都表明,奥巴马赢得大选的可能性超过95%,赌博市场虽然对美国总统大选结果的估计稍显模棱两可,但对奥巴马获选的支持率预测也达到了7∶1。
1704436015
1704436016 而“麦克劳夫伦讨论小组”的首席成员帕特·布坎南对这个问题却避而不谈。他说:“一切自有定数,本周末自然见分晓”,这句话引得其他成员一阵爆笑。来自《芝加哥论坛报》的克拉伦斯·佩吉预测说:“这场大选难分伯仲。”《福克斯新闻》的莫妮卡·克劳莉更加夸张,她大胆预测麦凯恩会以0.5个点险胜。只有《新闻周刊》的埃莉诺·克里夫特点明了显而易见的事实,她预测奥巴马最终会当选。
1704436017
1704436018 接下来的那个周二,结果出来了,奥巴马以365张选举人票对麦凯恩的173张选举人票当选为下一届美国总统,这一结果与民意测验和统计模型的预测结果基本吻合。虽然不是以压倒性的优势获胜,但也绝不是“难分伯仲”:奥巴马以总选票数高出近1000万张的实力击败麦凯恩,那些预测失败的人该想想怎样自圆其说了。
1704436019
1704436020 一周后,“麦克劳夫伦讨论小组”再次迎来上周那4位小组成员,这几位此次对上次预测失败的事情缄口不谈。他们讨论了奥巴马获胜的细枝末节,讨论了奥巴马任命拉姆·伊曼纽尔为下一届美国国务卿,还讨论了他与俄罗斯总统德米特里·梅德韦杰夫的交情。大家对上次失败的预测只字未提——尽管那次预测基本上与当时所有的证据背道而驰,并且还在美国国家电视节目中播出。事实上,小组的几位成员似乎自始至终都认为这样的结果是不可避免的。克劳莉是这样解释的:“2008年本就是个换届年,麦凯恩的竞选宣传太不到位了。”克劳莉似乎忘了仅仅一周前,她还把赌注押在麦凯恩一边。
1704436021
1704436022 我们不能单凭一次预测就对一位预言家做出评判,但有一种情况属于例外。截止到美国总统大选前的那个周末,认为麦凯恩仍将获胜的假设中,唯一说得通的也许就是大多数人对奥巴马都存在种族敌意,而这一点在民意调查中无法体现出来。然而,所有小组成员都没有提到这个假设。他们似乎是在另一个世界进行预测,那里没有民意测验,也没有经济崩溃,在那里美国总统小布什仍然很受欢迎,完全没有连累到麦凯恩。
1704436023
1704436024 虽然如此,我还是决定研究看看这种情况是否正常。“麦克劳夫伦讨论小组”花钱请来那些以谈论政治为生的专家们,他们是否真有预测的本事?
1704436025
1704436026 我对这个节目最后的预测环节中的近千份预测报告进行了评估,这些预测都是由麦克劳夫伦及其节目的其他专家做出的。其中近1/4的预测,要么模棱两可,要么不切实际,想要分析都无从下手。我将剩下的那些预测从完全错误到完全正确分为5个级别。
1704436027
1704436028 结果,就好像那些小组成员作预测时用了投掷硬币的方法一样,完全错误或基本错误的预测共有338份,而完全正确或基本正确的预测也是338份。
1704436029
1704436030 表2–1 “麦克劳夫伦讨论小组”预测分析
1704436031
1704436032  完全正确 
1704436033
1704436034  285 
1704436035
1704436036  39% 
1704436037
1704436038  大部分正确 
1704436039
1704436040  53 
1704436041
1704436042  7% 
1704436043
1704436044  部分正确,部分错误 
1704436045
1704436046  57 
1704436047
1704436048  8% 
1704436049
1704436050  大部分错误 
1704436051
1704436052  70 
[ 上一页 ]  [ :1.704436003e+09 ]  [ 下一页 ]