打字猴:1.70264339e+09
1702643390 赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 [:1702642307]
1702643391 赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 第7章 黑天鹅事件
1702643392
1702643393 7%的小概率风险如何在2005年成为击垮美国华尔街的天鹅”,井毁了全球金融体系。
1702643394
1702643395 归根结底,数据还是数据,肯定没有数据使用者聪明,但有些时候,数据也会让聪明绝顶的人干蠢事。我能想到的近几年来最不负责任的数据使用案例就是2008年金融危机爆发之前华尔街的风险评估机制了。那时候,整个美国金融行业使用的都是同一个风险晴雨表——风险价值(VaR)模型。理论上说,VaR既是一个简洁的指标(将大量信息整合为一个单独的数字),又有强大的概率学支撑(对每家公司的资产和交易头寸都给出了预期收益和损失值),是一个不可多得的投资工具。该模型认为,公司的每一项投资都存在着大量可能的结果,比如投资通用电气的股票,这些股票既有可能升值,也有可能贬值。如果在一个相对较短的周期内(比如一周)采用VaR模型进行投资评估,最有可能得到的结果是购入的股票在短期内基本维持原状,上涨或下跌10%的概率很小,上涨或下跌25%的概率就更小了,也就是说,变化越大,概率越小。
1702643396
1702643397 在分析了以往市场变动的数据之后,公司的数量分析专家(这是行业内的称呼,但在其他地方,人们更愿意称他们为“有钱的呆子”)会给出一个数字(比如说1300万美元),用来表示一项投资在一个特定周期内有可能让公司蒙受的最大损失,出现这种结果的概率为1%。也就是说,这项投资在99%的情况下会使公司的损失低于1300万美元,但还有1%的概率造成重大损失。
1702643398
1702643399 请记住上一段内容里的最后一句话,这句话至关重要。
1702643400
1702643401 在2008年金融危机爆发之前,各大公司对VaR模型信任有加,在量化整体风险时都会采用这一统计模型。假设一个交易商手上有923项不同的“敞口头寸”(即可能会出现涨跌的投资),每一项投资都能像通用电气股票的例子那样进行VaR分析,然后再计算得出该交易商手中的证券组合的总体投资风险,该公式甚至还考虑到不同投资之间的相关性。例如,如果两项投资的预期回报呈负相关关系,即一项投资的损失会被另一项投资的收益所抵消,那么这两项投资的整体风险要小于其中任意一项投资。一般而言,投资部门的主管会知道其手下的交易员鲍勃•史密斯的24小时VaR为1900万美元,即在接下来的24个小时内,鲍勃最多会让公司亏损1900万美元,而且这一情况发生的概率仅为1%。
1702643402
1702643403 更妙的是,该投资部门在任何时候都可以得出全公司的风险指数,只需要在上述基础上稍微向前推进一步即可。当然,这其中所包含的数学运算是非常复杂的,因为要考虑到公司所参与的种类繁多的金融产品,而且还涉及多国货币,每项投资的杠杆率(进行投资的贷款额)也不一样,不同国家的资金流动率也存在差别等。但这些都不能阻碍投资经理们在任何时候得出一个看上去十分精确的风险指数,正如《纽约时报》前财经作家乔·诺切拉所解释的那样,“VaR最吸引人的地方,也是其最大的卖点就在于将风险描述为一个单一的数字——一个美元数据,仅此而已,而那些恰好不擅长数量分析的人就会趋之若鹜。”摩根大通公司是VaR模型的创始者,经过不断的开发和完善,每日的VaR如今已经有了一个新的名称——4:15报告,因为在每天下午的4点15分,即当天的美国金融市场休市没多久,每一位公司高管的桌子上就都会出现VaR报告。
1702643404
1702643405 按理说这是一件好事,通常情况下总是信息越多越好,尤其当与风险联系在一起的时候。毕竟概率是一个非常强大的工具,施利茨啤酒公司的高管们在砸重金举办“超级碗”中场盲品活动直播之前,不是也借助了概率学吗?后来的效果,大家不也看到了吗?但那时的概率计算和现在的一样吗?
1702643406
1702643407 这可真不好说。有人说VaR模型是“潜在的灾难”,也有人认为赋予其“欺诈犯”,以及其他一些不适合写入“统计学家谱”的邪恶称呼,这一模型甚至还被看作2008年金融危机的始作俑者和罪魁祸首,那次金融危机之所以会爆发且程度严重,就是因为VaR。对于VaR模型最主要的诟病在于,金融市场的潜在风险并不像抛硬币或啤酒盲品会那么容易预测,该模型呈现出的“伪精准”会给投资者带来虚幻的安全感。VaR模型就像是一个不准的车速表,错误的速度数据对司机来说比没有车速表更危险。如果你对一个失准的车速表过于信任,你就会忽略其他提示车速不安全的信息;但如果车里压根儿就没有车速表,你反而会小心地注意四周,寻找能够告诉你车辆当前行驶速度的参照物。
1702643408
1702643409 大约在2005年,每个工作日的4点15分被放在投资经理办公桌上的VaR报告,见证着华尔街正在变成一条通往财富的“金光大道”。可是不幸的是,VaR模型的风险档案里隐藏着两个巨大的问题。第一,模型构建的概率基础参照的是过去的市场行为,然而金融市场和啤酒盲品会不一样,前者的未来不一定是历史的重复,没有任何的理论证据可以保证1980〜2005年间的市场动态是2005年之后市场表现的最佳预测参照物。从某些方面来看,这一缺乏想象力的行为总是认为即将开始的战争与上一场战争的情况差不多。从20世纪90年代开始一直到21世纪初,商业银行的房屋按揭业务所使用的贷款模型都认为房价出现大幅度下跌的概率为零。在以前,美国房价从来没有像2007年跌得那么惨、那么快,但这就是活生生的事实。美联储前主席格林斯潘在接受美国国会委员会质询时解释:“在2007年夏天,金融领域的理论大厦完全坍塌,这是因为之前的风险管理模型所收集的数据只涵盖了过去20年一经济快速增长的狂欢的20年。我认为,如果我们的模型能够充分地考虑历史上出现的几次危机,让模型更加完善的话,银行在放贷时的资本要求会更高,金融世界就会在更加健康和稳定的状态下运行。”
1702643410
1702643411 第二,即使通过基本数据,我们能够借助VaR准确地预测未来风险,这99%的保证依然存在着失效的危险,因为真正把事情搞砸的正是剩下的1%。对冲基金经理戴维·埃因霍恩解释说:“这就像你的汽车配备的安全气囊,平时看不出来有什么问题,但就在你发生车祸的时候它没有及时弹出来保护你。”假设一家公司的VaR为5亿美元,也就是说这家公司在未来给定的一段时间内损失不超过5亿美元的概率为99%,我们同样也可以这样理解,即这家公司有1%的概率遭受超过5亿美元的损失——而且在某些情况下的损失要大大超过5亿美元。事实上,这一模型根本没有办法告诉你假如那1%的情况发生,事态会有多严重。很少有人会关注“尾部风险”(位于分布曲线末尾的小概率事件),以及这些小概率风险所带来的灾难性后果。(如果你从酒吧出来打算回家,虽然你的血液中酒精含量只有0.15,撞车死亡的概率还不到1%,但酒后驾车依然是一个不明智的决定。)更甚的是,许多公司还天真地以为自己对那些小概率风险已经作了充足的准备,这无疑是雪上加霜。美国财政部前部长鲍尔森解释说,许多公司觉得只要出售资产,就能在很短的时间内筹集到现金。但危急关头,几乎所有公司都需要现金,这些公司全都在想办法出售相同类型的资产,从风险管理的角度看,这就像一个人说:“有灾难降临?那也没必要事先储备净水,到时候只需要去超市买几瓶矿泉水就行了。”可是当小行星真的撞上了你所在的小镇,生活在这里的其他5万名居民也想着要去超市买水,那么等你赶到超市的时候你会发现,超市的玻璃已经被砸了,货架上什么东西都没有。
1702643412
1702643413 当然,你会觉得担心行星撞地球这种小概率事件根本是杞人忧天,而这正是VaR模型灌输给投资人的想法。乔•诺切拉总结了《黑天鹅:如何应对不可预知的未来》[④]一书的作者,同时也是VaR模型的强烈反对者纳西姆•塔勒布的观点:“最大的风险从来就不是那些你能看得见、算得出的,而是那些你看不见从而无从估量的,那些看上去似乎远不在正常概率范围内、远远超出你的想象、你认为一辈子都不可能发生的风险,事实上,它们的确会发生,而且比你所能想到的要频繁得多。”
1702643414
1702643415 从某些方面来看,VaR模型的崩溃是施利茨啤酒案例的反面教材。施利茨的广告推广是基于一个已知的概率分布模型,无论参与盲品会的观众最后选择施利茨啤酒的概率为多少,施利茨公司总能通过运作将其转化为有利于自身品牌宣传的结果。施利茨甚至专门选取了其他品牌的忠实用户参与盲品会,以此来规避不利结果,就算只有不超过1/4的米切罗啤酒爱好者选择了施利茨(这在概率上基本属于不可能的范畴),施利茨依然可以声称每4位米切罗啤酒支持者中就有一位会考虑更换品牌。但这个例子最重要的一点或许是,不管概率怎么计算和预测,终归只是啤酒的事,与全球金融体系扯不上关系。
1702643416
1702643417 华尔街的数量分析专家们犯了3个最基本的错误。第一,他们混淆了“精确”和“准确”的概念。VaR模型就像是我的高尔夫测距仪,我以为计量单位是“码”,可实际显示的计量单位却是“米”:确实精确,但并不准确。错误的精确让华尔街的高管们自以为是地认为他们对风险状况尽在掌握。第二,他们对基础概率的估算方式是错误的。正如之前格林斯潘在接受质询时所指出的,不应该只用2005年以前相对平稳和繁荣的经济数据来预测接下来几十年的市场表现。这就好像一个人去赌场玩轮盘赌,心里想着自己有62%的概率会赢,因为上次玩轮盘赌赢钱的概率就是62%,结果怎么样呢?这对他来说将会是一个难熬、难忘的夜晚。第三,公司忽略了“尾部风险”,VaR模型预测的是那些发生概率为99%的结果,这也是概率的工作原理(本书的后半部分将会不断地重复这一概念h即使是貌似不可能的事件,也有发生的可能。事实上,放眼望去,它们并没有人们想象得那样罕见,每天都有人被雷击中,甚至我的妈妈打高尔夫球一杆进洞的情况都出现了3次。
1702643418
1702643419 供职于商业银行和华尔街的那些狂妄自负的统计专家,最终促成了自20世纪30年代大萧条以来最严重的全球金融紧缩,这场始于2008年的金融危机在美国导致了无法估量的美元币值蒸发,将失业率数字推高到了10%以上,引发了一波又一波的房屋止赎潮,还让世界各国政府都陷入了巨大的债务危机之中,它们在遏制经济损失的过程中苦苦挣扎。面对这样一个悲惨结局,类似于VaR模型这样旨在减少风险的精密金融工具给人们留下的除了讽刺,别无他物。
1702643420
1702643421 概率学提供了一系列强大且实用的工具,其中有许多工具都能为我们所用。如果使用得当,就能更好地辅助我们认识世界;如果使用不当,后果会不堪设想。鉴于全书内容我一直强调的是统计学是“一个强大的武器”,为此我想套用一下美国枪支权利支持者的话:概率学本身不会犯错,犯错的是使用它的人。本章接下来将会介绍一些最为常见的与概率有关的错误、误解和道德困境。
1702643422
1702643423 想当然地认为事件之间不存在联系。抛一次硬币得到正面的概率为1/2,抛两次硬币结果都为正面的概率为1/4,因为这两个事件是独立的,因此两次都得到正面的概率为各自概率的乘积。在领会了这一强大的概率学要点之后,你被正式提升为某大型航空公司的风险管理总监,你的助理告诉你越(大西)洋航班的引擎出现故障的概率为10万分之一,考虑到此类航班的班次较多,因此这样的风险还是应该极力避免。可喜的是,每一架越洋航班都配有至少两个引擎,你的助理计算得出在大西洋上空两个引擎都出现故障的概率为(1/100000)2,即100亿分之一——一个理论上安全的风险。这个时候,你作为风险管理总监,就可以让你的助理收拾东西回家,以后再也不用来了。因为两个引擎发生故障并不是彼此独立的事件,如果飞机在起飞时迎面飞来一群天鹅,那么两个引擎都有可能出现损坏。同样的,许多其他的因素也会对飞机引擎的性能造成影响,如天气变化、维护不当等。如果一个引擎出现了故障,那么第二个引擎出现故障的概率肯定要大大高于10万分之一。
1702643424
1702643425 意识到这一点很难吗?对于20世纪90年代的英国检方来说,恐怕确实很困难,正是因为对概率的不当使用,他们做出了一次严重的司法误判。就像刚刚假设的飞机引擎的例子一样,英国检方所犯的统计学错误正是想当然地认为几个不同事件之间是彼此独立的(跟抛硬币一样),而忽略了它们之间的联系(某个特定结果的出现会增加类似结果发生的可能性)。但这次的事件却是真实的,无辜的人因此蒙受了牢狱之灾。
1702643426
1702643427 错误源自一种名为婴儿猝死综合征(SIDS)的疾病,具体表现为健康的婴儿无明显病症突然死亡。由于死于其他原因的婴儿数量日趋减少,相比之下死于SIDS的婴儿变得越来越常见,因此SIDS越来越受到关注。也因为这些婴儿的死因如此神秘、难以解释,各方的猜测和怀疑始终不绝。有些时候,这一怀疑是有道理的,因为尸检并不能有效地区分自然死亡和疏忽致死,一些不负责任的家长会用SIDS作为挡箭牌,以掩盖他们对孩子的照顾不周和虐待。英国检方和法庭认为,如果一个家庭中先后发生多起婴儿猝死事件,那么就可以认定婴儿是疏忽致死,而非自然死亡。英国著名的儿科医师罗伊•麦都爵士就经常为这一观点做专家证人。英国《经济学人》杂志写道,“一个婴儿的死亡是悲剧,两个婴儿死亡就很可疑,三个婴儿死亡便可断定为谋杀,这就是大名鼎鼎的‘麦都定律’。其依据是如果某个事件的发生概率本来不高,但在相同家庭里发生两次甚至多次则不可能是巧合。”
1702643428
1702643429 麦都爵士在法庭上常常会向法官解释说,一个家庭先后有两个婴儿由于自然原因猝死的概率微乎其微,只有7300万分之一。具体计算过程是:婴儿猝死本身就比较罕见,发生概率为1/8500,那么相同家庭里两个婴儿猝死的概率就为(1/8500)2,也就是约7300万分之一。如果一个家庭有两个婴儿猝死,基本上可以断定孩子的父母是极不负责任的家长,判他们过失致死罪一点儿都不为过。在没有任何医学证据表明存在虐待或过失行为的前提下,法官一般都会采纳麦都爵士的专家意见,家长因此锒铛人狱。甚至有时候在出现过婴儿猝死的家庭,刚出生的婴儿会被强制送往其他地方抚养,以远离其亲生父母的“迫害”。
1702643430
1702643431 对统计事件独立性的错误理解,致使麦都爵士证词的严密性受到挑战,《经济学人》就此写道:
1702643432
1702643433 英国皇家统计学会指出,麦都爵士的逻辑存在一个明显的漏洞。概率计算本身没有问题,但前提是必须保证婴儿猝死事件是完全随机的,相互之间不存在任何未知的联系。但由于医学界对婴儿猝死综合征还未完全了解,同一家庭中先后猝死的婴儿之间非常有可能存在某种联系,例如基因等,从而让一个已经遭受婴儿夭折打击的家庭再次遭受打击。但由于那些家长已经被定罪,为了维护司法的严肃性,科学家们的建议是可能存在某种联系,仅此而已。
1702643434
1702643435 2004年,英国政府宣布对258起已经结案的家长谋杀婴儿的案件进行重审。
1702643436
1702643437 对两个事件的统计独立一无所知。人们犯的另一种常见错误是,面对相互独立的事件浑然不觉,甚至还将它们作为相关事件进行处理。假设你正在一家赌场里(虽然从统计学的角度看,你根本就不应该出现在这种地方),你会看到赌客们红着眼睛盯着骰子或扑克牌,嘴里念念有词“总该轮到我赢了吧”。如果轮盘球已经连续5次停在黑色区域了,有人就会想当然地认为下一次肯定会停在红色区域,大错特错!轮盘球停在红色区域的概率一直都没变,应该是16/38,这就是“赌徒谬论”。事实上,就算你连续抛1000000次硬币,并且结果全都是正面朝上,第1000001次抛硬币出现反面的概率依然为1/2。两个事件的统计独立性的定义正是其中一个事件的结果对另一个事件的结果不存在任何影响。就算你觉得从统计学的角度来解释不够有说服力,你也可以从物理的角度问问自己:一枚硬币连续抛几次的结果都是反面朝上,怎么做才能使它下一次抛出的结果是正面朝上?
1702643438
1702643439 即使在体育领域,这种线性思维也同样会给人带来错觉。有一篇广为人知、妙趣横生的与概率学相关的学术论文就驳斥了体育迷头脑中一个根深蒂固的观念,那就是篮球运动员存在“手感”这一现象,即手感来了,怎么投都能中,一投一个准,但手感一走,投篮命中率立即下降。绝大多数的体育迷们都相信,一个刚刚投篮得分的球员再次投中的概率要大于刚刚投篮失手的球员。但对于托马斯•季洛维奇、罗伯特•瓦隆和阿莫斯•特韦尔斯基这3位研究者来说,根本不存在所谓的“手感”一说,为此他们用了3种不同的方式来证明。首先,他们分析了费城76人队在1980~1981赛季主场的得分数据(当时,美国篮球职业联盟NBA的其他球队还没有类似的数据统计),发现“没有证据表明连续进球之间存在正相关关系”。随后,他们分析了波士顿凯尔特人队的罚球数据,也得出了相同的结论。最后,他们邀请了康奈尔大学男篮和女篮成员队参与控制试验,这些篮球队队员在上一个投球命中的情况下再进一球的概率为48%,上一个投球未中的情况下投球命中率为47%。对于年龄区间在14~26岁的运动员来说,一次投篮命中和再次投篮命中之间的关联是负相关的。在这一点上,全场只有一位运动员表现出了强烈的正相关关系。
[ 上一页 ]  [ :1.70264339e+09 ]  [ 下一页 ]