1702643290
1702643291
1702643292
1702643293
1702643294
图5-4投资决策
1702643295
1702643296
如此看来,这项投资的预期回报是非常诱人的,高达422.5万美元。但我还是不建议你用辛辛苦苦积攒的、准备将来给孩子读大学的钱来进行投资。观察决策树形图,你会发现预期回报大大高于一开始的投资额,但不要忘记,最有可能发生的结果是研发失败,以致治疗男性脱发的产品最终没有面世,而你只能拿回剩下的25万美元。至于你对这项投资的胃口到底有多大,就要取决于你的风险倾向了。对此,大数定律给出的建议是,对于一家投资公司或像巴菲特这样富可敌国的个人投资者来说,应该尽可能地发掘上述例子这类结果不确定但预期回报很丰厚的投资机会,而且数量越多越好,几百个项目里面肯定有一些会成功,一些会失败,但平均来看,这些投资者最终会像保险公司或赌场那样挣到大钱。如果预期收益对你有利,那么涉足的项目越多,赚钱的机会就越大。
1702643297
1702643298
同样的道理,我们还可以用来解释一个有违直觉的现象。有时候,针对全美国人口监测如艾滋病这类罕见但严重的疾病是行不通的。假设我们对某种罕见病的检测拥有相当高的准确度,举例来说,每10万人中会有一个人患上某种疾病,检测准确率为99.9999%,可以保证在检测过程中不产生一例伪阴性(也就是从不漏过任何一个患上该病的人),但产生伪阳性(也就是一个没有患上该病的健康人被误测为阳性)的概率为万分之一。这样就会导致一个棘手的状况,虽然这种疾病的检测准确率非常之高,但绝大部分被诊断为阳性(也就是患有该疾病)的人实际上根本没有得此病。这会在那些诊断结果为阳性的人群中产生巨大恐慌,后续的检测和治疗也会浪费有限的医疗资源。
1702643299
1702643300
如果我们对美国所有成年人,即约1.75亿人口进行检测,决策树形图如图5-5所示。
1702643301
1702643302
1702643303
1702643304
1702643305
图5-5 某疾病全美国筛査情况
1702643306
1702643307
只有1 750位成年人患有该疾病,他们的检测结果均为阳性。有超过1.74亿 成年人未患病,在这部分健康人群中,有99.999%的人得到了正确的检测结果,只有0.01%的人被误检为阳性。但1.74亿的0.01%依然是一个非常大的数字,因此在实际操作中平均将会有1.75万健康的人被告知患有该疾病。
1702643308
1702643309
这意味着什么?我们一起来分析一下。总共有19250人的检测结果为阳性,但真正患病的只有9%,而且这还是一个准确性非常高、伪阳性非常低的检测。我想不需要作太多解释,大家就能理解为什么在削减医疗开支的过程中,我们该做的不是对健康人群加强疾病筛查,而是减少这类检测。以艾滋病为例,公共健康官员总是建议将有限的资源用在“刀刃”上,即用在男同性恋者、.采取静脉注射的吸毒分子等高危人群身上。
1702643310
1702643311
有时候,我们能够借助概率发现一些可疑的事情。在第1章的内容里,我介绍了标准化考试过程中出现的组织作弊问题,还顺带提到了专门负责发现此类作弊行为的考试安全公司。而实际上,负责执行证券交易相关法律的美国证券交易委员会在稽查内幕交易行为的过程中,使用的也是类似的方法。(内幕交易包括非法使用内部信息来交易相关公司的股票或证券,如即将开展的公司收购——这类信息一般来说只有负责此事的律师事务所才知道)。美国证券交易委员会动用计算能力超强的电脑来分析数亿美元的股票交易,试图寻找可疑行为,如公司收购信息即将披露之前进行的大额股票购入、公司正准备宣布亏损前的大量抛售等。那些常年取得超高收益的投资经理们也是美国证券交易委员会的重点调查对象,因为无论是经济理论还是历史数据都告诉我们,每年的收益都超过平均水平对于一个投资者来说,几乎是不可能的。当然,聪明绝顶的投资者们总是能够预测到市场的走势,在法律允许的范围内设计出完美的投资策略,获得高于市场平均数的收益。一个好的投资者不一定非得使用不正当的手段,不过电脑是怎么区分好人和坏人的呢?我多次致电美国证券交易委员会的执法部门,咨询他们是借助哪些模型来确定犯罪行为的,但他们至今也没有给我回复。
1702643312
1702643313
在电影《少数派报告》(2002)中,汤姆•克鲁斯扮演的是一位预防犯罪探员,借助科技手段在坏人作案之前,预测他们的犯罪行为。
1702643314
1702643315
2002年,这部电影还只是一部科幻片,但到了2011年,这就成了现实。《纽约时报》在这一年刊登了一篇报道,标题为“在犯罪发生前派遣警力”,讲的是圣克鲁兹市警察局的电脑程序预测出闹市区的一个停车场将有可能发生汽车盗窃案件,于是自动派遣了一队警察前往现场,到场的警察随后逮捕了两个形迹可疑、偷瞟车窗的女人,其中一个人是警局的常客,另外一个人身上携带着毒品。
1702643316
1702643317
圣克鲁兹市的电脑程序是由两位数学家、一位人类学家和一位刑事学家共同设计的。芝加哥警察局还专门设立了一个犯罪预测分析小组,原因是这个城市的暴力犯罪主要源自团伙作案,而这些团伙的作案手段往往有规律可循。在《数据挖掘和预测分析:情报收集和犯罪分析》一书中,作者将统计学运用到执法过程中,开篇是这样写的:“目前在犯罪侦查领域,预测未来已经成为可能,诸如识别犯罪趋势、判断社区热点、优化资源调度等,以求最有效率地为市民提供最多的保护。”(对了,这些内容我总结给你们看就行了,亲爱的读者们就不必费心再去读那本书了。)“预测执法”属于预测分析学的一部分。犯罪总是带有不确定的成分,就好像没有一方能够确切地说谁会撞车、谁会还不起贷款。在面临这些风险时,概率学能够帮助我们走上正确的分析道路。此外,信息的收集和积累能够让我们更好地理解相关事件的概率。在充满不确定性的商业世界里,商人们总是希望能够将他们的风险量化,放贷者会要求查看贷款人的收入证明和信用评分,但这些迟钝的信用工具在预测未来方面的作用充其量不过是史前洞穴人手中的石器,大量的电子数据和廉价的电脑计算才真正能够为我们揭示人类的行为。保险推销员准确地将他们的行业描述为“风险转移”,因此他们最好先理解转移的风险究竟是什么。像好事达这样的保险公司之所以成功,是因为它们知道并重视那些在别人眼里可能毫无关联的随机事件:
1702643318
1702643319
•年龄为20〜24岁的司机最有可能造成致命交通事故。
1702643320
1702643321
•在伊利诺伊州最经常失窃的车是本田思域(亚拉巴马州为全尺寸雪佛兰皮卡)。
1702643322
1702643323
•一边开车一边发短信容易造成事故,但各州出台的禁止开车发短信的法律似乎并没有遏制这种行为。事实上,这些法律甚至有可能让情况变得更糟,因为司机在发短信时会想办法将手机藏得更为隐蔽,更加不把心思放在专心开车上。
1702643324
1702643325
信用卡公司一直处于这类分析法的前沿,原因有二:这些公司的数据库里保存着大量有关我们消费习惯的数据,而且它们的商业模式离不开那些信用风险适中的客户。那些拥有最佳信用记录的客户每个月总能准时付清账单,信用卡公司没法从他们身上赚得一点儿利息;那些账单数额巨大且经常忘记按时还款的客户才是信用卡公司的“金主”,高额的利息给公司带来了丰厚的利润,只要这些客户不违约就行。经营汽车产品及其他零售商品的加拿大轮胎公司有一位“爱好数学的首席执行官”J·P·马丁,他专门研究在面对商品时,哪些人更愿意掏钱消费,而哪些人倾向于转身离开。这是一个非常有趣的课题,马丁对上一年使用加拿大轮胎联名信用卡消费的每一笔交易数据进行了数据分析,发现在综合考虑收入、信用纪录等传统统计指标的基础上,观察消费者购买了什么商品能够准确地预测出他们接下来的消费行为。
1702643326
1702643327
《纽约时报》上一篇标题为“你的信用卡公司对你知道多少?”的文章描述了马丁发现的一些有趣现象:“选择购买价格便宜、通用汽油的消费者有错过信用卡还款日期的可能,而那些选择高档名牌商品的消费者倒是经常按时还款,那些会为家里添置一氧化碳探测器或凳脚套防止刮伤地板的人几乎从来不会延期还款,所有购买骷髅头造型汽车挂饰或对汽车的排气系统进行大排量改装的人基本上不会按时还款。”
1702643328
1702643329
当我们在生活中遇到不确定因素时,概率学是一个可靠的参考工具。你不应该购买彩票;如果你有一个长远的投资视野,那么你应该把钱投入股市(因为股票是能够带来长期收益的一种典型投资品种);你应该为某些东西购买保险,其他东西就算了;概率学甚至还能助你在游戏竞赛节目中扩大赢面(下一章内容就会讲到)。
1702643330
1702643331
虽然说了(写了)这么多,但还是要再多说一句:概率并不是确定的。你不应该购买彩票,但你依然有可能通过购买彩票发财。是的,概率学能够帮助我们揪出作弊者、追踪大坏蛋,但若使用不当,我们就有可能把无辜的人送进监狱。这就是为什么我要写第7章的内容。
1702643332
1702643333
1702643334
1702643335
1702643337
赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 第6章 蒙提•霍尔悖论
1702643338
1702643339
在《让我们做个交易》节目中,主待人打开的3号门后面是一头羊,在剩下的7号门和2号门中必定有一扇门后面是汽车,你应该如何选择才能中大奖?
[
上一页 ]
[ :1.70264329e+09 ]
[
下一页 ]