打字猴:1.70443597e+09

1704435970

1704435971 你也不是酒鬼，醉驾这种事情似乎永远不会发生在你的身上。但是，有一年在公司的圣诞派对上，一位好友要离开公司，你当时的工作压力又很大，于是情绪出现了波动，不知不觉间喝了12杯伏特加，你喝醉了。此时该开车回家，还是叫一辆出租车呢？

1704435972

1704435973 这个问题的答案肯定是叫辆出租车载你回家。

1704435974

1704435975 但你突发奇想要自己开车回去，你是这样为自己找理由的：自己曾经有20000次驾车出行的经历，只发生过两起小意外，其他19998次都安全抵达目的地。安全率这么高，又何必那么麻烦让出租车载你回家呢？

1704435976

1704435977 但问题是，20000次出行记录没有一次是像这次醉酒驾车的，你的醉驾样本数量不是20000次，而是零次。因此，用先前的经验预测此次驾车的风险是毫无根据的。这个例子就解释了什么是“非样本”问题。

1704435978

1704435979 这一问题看似很容易避免，但评级公司正是犯了这一错误。穆迪公司根据过去的数据——特别是美国自20世纪80年代以来的房地产市场数据——构建了一个预测模式，以此来评估不同抵押违约行为之间的关联程度。问题是，从20世纪80年代到21世纪初期的二十几年的时间里，美国的房价一直保持稳定或略有增长。在这种情况下，认为一个房主的抵押贷款与其他贷款没有什么关系，这种假设看起来好像没有什么问题。但这些从前的数据无法显示当房价开始不断走低时会出现什么情况。房市崩盘是“非样本”事件，评级公司在此基础上对违约风险进行评价的预测模式也就毫无价值可言。

1704435980

1704435981 前事不忘，后事之师

1704435982

1704435983 然而，穆迪公司当时并未竭尽所能，如果它们当时能放宽眼界，还是可以得到更合理的评估结果的。美国此前确实没有经历过房地产市场的崩盘，但其他国家经历过，而且结果惨不忍睹。如果穆迪公司对日本房地产泡沫后的违约率有所了解，就会更加理性地看待抵押贷款支持证券的危险性，也就不会给出3A 评级了。

1704435984

1704435985 很多预测者通常都不愿意考虑“非样本”中存在的这些问题。当我们将样本扩大到涵盖了那些在时空上都离我们很远的事件时，这通常意味着我们会遇到一些自己并不熟悉或与所进行研究关系并不紧密的案例。因此，这一模式看上去就不那么有说服力，展示在幻灯片（或期刊论文或博客）中时，也不会给人留下很深刻的印象。在这种情形下，我们只好承认自己对这个世界的了解并没有想象的多，而我们的个人感受和职业动机几乎总在阻止我们这样做。

1704435986

1704435987 我们忘了——也可能是故意忽略——我们的预测模式就是简化了的世界，我们以为即使犯了错，也无大碍。

1704435988

1704435989 然而，在复杂的系统中，错误都不是用程度来衡量的，而是用级别衡量的。标准普尔和穆迪将债务担保凭证的违约风险低估了200倍，那些经济学家认为发生概率只有500分之一的经济衰退也实实在在地上演了。

1704435990

1704435991 就像我在引言中提到的那样，在信息时代我们面临的一个重大挑战，就是全球的知识总量在增加，而我们实际掌握的知识和自认为掌握的知识之间的鸿沟却越来越宽。这一症状与那些貌似精确实则错误的预测是有关联的。穆迪将计算结果保留到小数点后两位，看似精确却脱离了实际。这就好比你说自己是一位射击高手，因为你的子弹每次都能射中同一个位置，即使每一枪都离目标十万八千里，你也会这样讲。

1704435992

1704435993

1704435994

1704435995

1704435996 图1–6 准确度与精确度对比

1704435997

1704435998 金融危机以及其他大多数失败的预测都源于一种盲目的自信。他们用精确的预测冒充准确的预测，于是我们有些人就上当了，还将赌注翻番。我们自以为已经克服了辨别力中的盲点，却没有料到实力雄厚如美国这样的国家此时经济的发展也戛然而止了。

1704435999

1704436000

1704436001

1704436002

1704436003 信号与噪声：大数据时代预测的科学与艺术 [:1704435321]

1704436004 信号与噪声：大数据时代预测的科学与艺术第二章政治选举预测：狐狸和刺猬，谁更聪明？

1704436005

1704436006

1704436007

1704436008 对许多人来说，政治预测就是“麦克劳夫伦讨论小组”这档电视节目的同义词。从1982年开始，每周日电视台都会播出这样一场“政治圆桌会议”，之后还会被“周六夜现场”节目恶搞一番。节目主持人约翰·麦克劳夫伦是一个80多岁的暴脾气老人，曾在1970年竞选美国参议员时落败。该节目像组织体育活动一样组织政治专家展开讨论，小组成员要在半个小时内循环讨论四五个话题，麦克劳夫伦会就相关话题对这些成员步步紧逼，这些话题从澳大利亚政治探讨到地外智慧生物探寻，无所不包。

1704436009

1704436010 “麦克劳夫伦讨论小组”每期节目的最后都设有一个“预测”的环节，在这个环节中，小组成员用几秒钟的时间讨论当天发生的某件事的重要性。有时，他们可以选择一个和政治关系不大的话题进行预测；有时，麦克劳夫伦会就某一个特定问题突击询问小组成员，让他们现场作答，麦克劳夫伦称此为“强迫性预测”。

1704436011

1704436012 麦克劳夫伦的有些问题很难回答，比如让小组成员从几个最佳候选人中选出最高法院的下届法官。其他问题则比较温和，比如2008年美国总统大选前夕，他曾让小组成员预测麦凯恩和奥巴马谁会当选。

1704436013

1704436014 答案显而易见。2008年9月15日，雷曼兄弟宣布破产，引发了自20世纪30年代大萧条时期之后最严重的经济衰退，正是从那天起，奥巴马的选票数几乎在所有的美国投票站都领先麦凯恩。而且，不论是在俄亥俄州、佛罗里达州、宾夕法尼亚州或是新罕布什尔州这样的“摇摆”州，还是在一些民主党很少获胜的地区，如科罗拉多州和弗吉尼亚州，奥巴马也都处于领先地位。我为自己的网站开发的预测模式和其他类似的统计模式都表明，奥巴马赢得大选的可能性超过95%，赌博市场虽然对美国总统大选结果的估计稍显模棱两可，但对奥巴马获选的支持率预测也达到了7∶1。

1704436015

1704436016 而“麦克劳夫伦讨论小组”的首席成员帕特·布坎南对这个问题却避而不谈。他说：“一切自有定数，本周末自然见分晓”，这句话引得其他成员一阵爆笑。来自《芝加哥论坛报》的克拉伦斯·佩吉预测说：“这场大选难分伯仲。”《福克斯新闻》的莫妮卡·克劳莉更加夸张，她大胆预测麦凯恩会以0.5个点险胜。只有《新闻周刊》的埃莉诺·克里夫特点明了显而易见的事实，她预测奥巴马最终会当选。

1704436017

1704436018 接下来的那个周二，结果出来了，奥巴马以365张选举人票对麦凯恩的173张选举人票当选为下一届美国总统，这一结果与民意测验和统计模型的预测结果基本吻合。虽然不是以压倒性的优势获胜，但也绝不是“难分伯仲”：奥巴马以总选票数高出近1000万张的实力击败麦凯恩，那些预测失败的人该想想怎样自圆其说了。

1704436019

[ 上一页 ] [ :1.70443597e+09 ] [ 下一页 ]