1702643315
2002年,这部电影还只是一部科幻片,但到了2011年,这就成了现实。《纽约时报》在这一年刊登了一篇报道,标题为“在犯罪发生前派遣警力”,讲的是圣克鲁兹市警察局的电脑程序预测出闹市区的一个停车场将有可能发生汽车盗窃案件,于是自动派遣了一队警察前往现场,到场的警察随后逮捕了两个形迹可疑、偷瞟车窗的女人,其中一个人是警局的常客,另外一个人身上携带着毒品。
1702643316
1702643317
圣克鲁兹市的电脑程序是由两位数学家、一位人类学家和一位刑事学家共同设计的。芝加哥警察局还专门设立了一个犯罪预测分析小组,原因是这个城市的暴力犯罪主要源自团伙作案,而这些团伙的作案手段往往有规律可循。在《数据挖掘和预测分析:情报收集和犯罪分析》一书中,作者将统计学运用到执法过程中,开篇是这样写的:“目前在犯罪侦查领域,预测未来已经成为可能,诸如识别犯罪趋势、判断社区热点、优化资源调度等,以求最有效率地为市民提供最多的保护。”(对了,这些内容我总结给你们看就行了,亲爱的读者们就不必费心再去读那本书了。)“预测执法”属于预测分析学的一部分。犯罪总是带有不确定的成分,就好像没有一方能够确切地说谁会撞车、谁会还不起贷款。在面临这些风险时,概率学能够帮助我们走上正确的分析道路。此外,信息的收集和积累能够让我们更好地理解相关事件的概率。在充满不确定性的商业世界里,商人们总是希望能够将他们的风险量化,放贷者会要求查看贷款人的收入证明和信用评分,但这些迟钝的信用工具在预测未来方面的作用充其量不过是史前洞穴人手中的石器,大量的电子数据和廉价的电脑计算才真正能够为我们揭示人类的行为。保险推销员准确地将他们的行业描述为“风险转移”,因此他们最好先理解转移的风险究竟是什么。像好事达这样的保险公司之所以成功,是因为它们知道并重视那些在别人眼里可能毫无关联的随机事件:
1702643318
1702643319
•年龄为20〜24岁的司机最有可能造成致命交通事故。
1702643320
1702643321
•在伊利诺伊州最经常失窃的车是本田思域(亚拉巴马州为全尺寸雪佛兰皮卡)。
1702643322
1702643323
•一边开车一边发短信容易造成事故,但各州出台的禁止开车发短信的法律似乎并没有遏制这种行为。事实上,这些法律甚至有可能让情况变得更糟,因为司机在发短信时会想办法将手机藏得更为隐蔽,更加不把心思放在专心开车上。
1702643324
1702643325
信用卡公司一直处于这类分析法的前沿,原因有二:这些公司的数据库里保存着大量有关我们消费习惯的数据,而且它们的商业模式离不开那些信用风险适中的客户。那些拥有最佳信用记录的客户每个月总能准时付清账单,信用卡公司没法从他们身上赚得一点儿利息;那些账单数额巨大且经常忘记按时还款的客户才是信用卡公司的“金主”,高额的利息给公司带来了丰厚的利润,只要这些客户不违约就行。经营汽车产品及其他零售商品的加拿大轮胎公司有一位“爱好数学的首席执行官”J·P·马丁,他专门研究在面对商品时,哪些人更愿意掏钱消费,而哪些人倾向于转身离开。这是一个非常有趣的课题,马丁对上一年使用加拿大轮胎联名信用卡消费的每一笔交易数据进行了数据分析,发现在综合考虑收入、信用纪录等传统统计指标的基础上,观察消费者购买了什么商品能够准确地预测出他们接下来的消费行为。
1702643326
1702643327
《纽约时报》上一篇标题为“你的信用卡公司对你知道多少?”的文章描述了马丁发现的一些有趣现象:“选择购买价格便宜、通用汽油的消费者有错过信用卡还款日期的可能,而那些选择高档名牌商品的消费者倒是经常按时还款,那些会为家里添置一氧化碳探测器或凳脚套防止刮伤地板的人几乎从来不会延期还款,所有购买骷髅头造型汽车挂饰或对汽车的排气系统进行大排量改装的人基本上不会按时还款。”
1702643328
1702643329
当我们在生活中遇到不确定因素时,概率学是一个可靠的参考工具。你不应该购买彩票;如果你有一个长远的投资视野,那么你应该把钱投入股市(因为股票是能够带来长期收益的一种典型投资品种);你应该为某些东西购买保险,其他东西就算了;概率学甚至还能助你在游戏竞赛节目中扩大赢面(下一章内容就会讲到)。
1702643330
1702643331
虽然说了(写了)这么多,但还是要再多说一句:概率并不是确定的。你不应该购买彩票,但你依然有可能通过购买彩票发财。是的,概率学能够帮助我们揪出作弊者、追踪大坏蛋,但若使用不当,我们就有可能把无辜的人送进监狱。这就是为什么我要写第7章的内容。
1702643332
1702643333
1702643334
1702643335
1702643337
赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 第6章 蒙提•霍尔悖论
1702643338
1702643339
在《让我们做个交易》节目中,主待人打开的3号门后面是一头羊,在剩下的7号门和2号门中必定有一扇门后面是汽车,你应该如何选择才能中大奖?
1702643340
1702643341
“蒙提•霍尔悖论”是一个著名的概率难题。1963年美国开播的电视游戏节目《让我们做个交易》中,参赛者们就会面临这个难题。正是这个亘古不变却又兴致盎然的悖论,让这类竞赛游戏长盛不衰,至今有许多国家的电视台依然在制作并播放类似的节目。记得读小学的时候一回家我就会打开电视观看《让我们做个交易》。这个节目给统计学家带来了巨大的惊喜,关于这一点我在序言里已经讲过了。每一期节目播到最后,总会有一个参赛者脱颖而出,站在主持人蒙提·霍尔旁边,在他们的眼前有3扇巨大的门,编号分别为1、2、3。蒙提会告知参赛者,其中的一扇门的门后摆放着极为诱人的大奖(比如说一辆小轿车),而另外两扇门的后面各站着一头羊,参赛者需要在这3扇门中选择一扇门,并获得那扇门后面的奖品。(如果有参赛者选中了羊,我怀疑他们是不是真的会把那头羊牵回家,因为在普通人看来,绝大多数参赛者都希望能开一辆新车回去。)
1702643342
1702643343
游戏刚开始时,中大奖的概率一目了然,两头羊和一辆车,参赛者有1/3的概率选中那扇后面是轿车的大门。但正如之前提到的,这个节目及其主持人蒙提•霍尔之所以能够在美国概率学课本中占得一席之地,是因为这个节目还有一个精心的
1702643344
1702643345
安排。当参赛者选择了一扇门之后,蒙提会打开剩下的两扇门中的一扇,向观众和选手展示这扇门后面的奖品——一头羊,然后蒙提会再次询问参赛者是否要改变当初的选择,也就是在最初选择的那扇门和剩下的那扇门中再选择一次。
1702643346
1702643347
为了让表述更加清楚,我们假设参赛者最初选择的是1号门,蒙提随后打开了3号门,发现门后站着一头活羊。此时,场上还有两扇门是关着的,1号门和2号门,如果小轿车藏在1号门的后面,那么参赛者就中奖了,如果小轿车藏在2号门的后面,参赛者就会与大奖失之交臂。但就在这个时候,蒙提并不急于揭晓答案,而是再次询问参赛者是否坚持原来的选择,如果参赛者改变主意了,就相当于放弃了一开始选的1号门,而改选2号门。记住,这两扇门此时依旧紧闭着。参赛者唯一得到的新信息是,在自己刚刚没有选择的那两扇门中,至少有一扇门的后面是一头羊。
1702643348
1702643349
参赛者应不应该改变最初的选择?
1702643350
1702643351
答案是肯定的。如果参赛者坚持最初的选择,那么中大奖的概率为1/3,如果改选剩下的那扇门,那么中奖的概率就是2/3。如果你不相信的话,请往下读。
1702643352
1702643353
我承认这样的一个答案似乎有违直觉,因为在这个过程中,参赛者中大奖的概率似乎一直都是1/3,不管这个参赛者后来有没有改变选择。一共有3扇关闭的大门,一开始的时候每一扇大门后面藏着大奖的概率都是1/3,但是当参赛者改变自己最初的选择转而选择另一扇门之后,中奖的概率会随之变化吗?
1702643354
1702643355
问题的关键就在于,主持人蒙提•霍尔本人是知道每一扇门背后的奖品的。如果参赛者选择了1号门,而且恰好小轿车就在这扇门的门后,那么蒙提就可以在2号或3号门中随便选一扇门打开,向观众展示一头羊。
1702643356
1702643357
如果参赛者选择了1号门,而小轿车停在2号门后,那么蒙提就会打开3号门。
1702643358
1702643359
如果参赛者选择了1号门,而小轿车停在3号门后,那么蒙提就会打开2号门。
1702643360
1702643361
通过改变之前的选择,参赛者就能从两次选择中获益,好处自然要比一次选择多。为了说服大家,我会用3种不同的方法来证明这一分析的正确性。
1702643362
1702643363
第一种是从经验主义角度出发的。2008年,《纽约时报》专栏作家约翰•泰拿尼专门就“蒙提·霍尔现象”写了一篇文章。随后这份报纸还在网站上开辟了一个互动专题,读者可以亲身体验这个游戏,包括提示你是否要改变选择,游戏的最后甚至还有可爱的小羊和小轿车从门后跳出来揭晓答案。这个游戏会记录下你改变和坚持最初选择的成功率,你可以试一下。我特地让我的小女儿玩了100次这个游戏,每次都在打开一扇有羊的门后改变最初的选择;然后又找她的哥哥玩了100次,全都坚持一开始的选择。我的女儿有72次中了大奖,儿子只中了33次。他们都从我这里获得了两美元的辛苦费。
1702643364
[
上一页 ]
[ :1.702643315e+09 ]
[
下一页 ]