1702642600
1702642601
概率、风险与考试作弊
1702642602
1702642603
从长远看,赌场总是能够挣到钱,而且无一例外。这并不是说赌场每时每刻都在赚钱,每当赌场里的钟声和口哨声响起时,就代表某位幸运的赌客刚刚赢走了几千美元。整个博彩事业是建立在机遇游戏之上的,也就是说任何一次骰子的投掷和扑克牌的翻牌都是不确定的。但与此同时,相关事件的潜在概率又是已知的,比如“黑杰克”抽中21点或“轮盘赌”转到红色的概率是固定的。当这些游戏的概率对赌场有利时(赌场当然不会亏钱),不管场内的钟声和口哨声有多热闹,或者赌客手里的赌注积累得有多大,赌场永远都是最终的赢家。
1702642604
1702642605
这一统计现象在生活中所产生的影响远比在赌场里大得多。许多公司会对某些最不愿意遇到的风险进行概率评估,公司的管理层都知道想要完全避免这些风险是不可能的,就像赌场没法保证赌客们每一手牌都会输一样。但是,任何一家面对不确定因素的公司都可以通过商业流程的设计来管理这些风险,将从环境灾难到不合格产品等一系列不利因素的出现概率降至可接受的范围内。华尔街各大公司经常会对它们的投资组合进行风险评估,充分考虑不同情景的出现概率以设计出合理的应对方案。2008年金融危机爆发的部分原因,就是一系列之前被认为是极不可能发生的市场事件都成为现实,就好像赌场里的每一位赌客在某一晚同时抽中大奖一样。我会在之后的章节里向大家解释,其实华尔街的投资模型都存在缺陷,这些公司用来评估风险的数据也过于局限,但此时此刻,我想说的是,任何一个风险评估模型都必须以概率作为基础。
1702642606
1702642607
面对难以接受的风险,如果个人和企业无法规避,就会通过其他方式寻求保护。保险业应运而生,通过收取保费,保险公司为其客户在遭遇如车祸、火灾等不良事件后提供保护。保险公司并不是通过消除这些不良事件来挣钱,因为车祸和火灾每天都会发生,甚至汽车有可能会一下子撞进房子里引起火灾。保险公司收取高额的保费,用于支付车祸、火灾等意料之中的风险的赔偿金,然后往往还会有大量盈余。(保险公司还可以通过宣传安全驾驶、在游泳池周围装设围栏、为每个卧室安装烟雾探测器等方式来减少预期的损失赔偿。)
1702642608
1702642609
概率在有些情况下甚至可以被用来判断考试作弊。一家由美国学术能力评估考试(SAT)的一位开发者创办的考试安全公司,专注于提供“数据取证”服务,为客户寻找考试作弊的蛛丝马迹。举个例子,在学校或考点进行的考试,多名考生以同样的答案答错同一道题的情况是极少见的,通常发生的概率只有不到百万分之一,如果有类似的情况出现,该公司就会予以标记。其数学逻辑源自一个事实,即当大部分考生对某道题都给出了正确答案时,我们并不会感到大惊小怪,因为这是他们应该做的事情。这些考生有作弊的可能,但他们凭一己之力做对题的可能性更大。但是当这一群考生答错题的时候,他们的错误答案不应该是完全一样的,如果错误答案完全一样,那么他们就有可能是相互抄袭(或者通过短信息分享答案)。此外,还有几种情况会引起该公司的注意,比如在一场考试中,考生在难题上的正确率大大高于容易的题(这意味着他们有可能提前就知道答案);又或者在一场考试中,收上来的答题卡上“错改对”的涂改痕迹要明显多于“对改错”(这意味着有可能是老师或监考人员在考试结束后对答题卡动了手脚)。
1702642610
1702642611
当然,你也不难看出概率也有其局限性。一大群考生在某道题上出现相同的错误答案的情况完全有可能是巧合,事实上,如果参与评估的学校越多,我们就越有可能认为这类情况实属巧合。并不是说我们一旦在统计时发现异常情况,就马上认定考试存在作弊现象。来自亚特兰大的德尔玛•金尼在2008年中了价值100万美元的彩票,谁知到了2011年又中了价值100万美元的彩票。这种同一个人连续两次中大奖的概率只有25万亿分之一,可我们不能仅凭概率几乎为零就以诈骗罪将金尼先生关进大牢(但我们或许可以调查一下,他是否有亲戚在彩票公司工作)。概率就像是武器库里的一件武器,需要使用者有较强的判断力。
1702642612
1702642613
哪些人最有可能成为恐怖分子?
1702642614
1702642615
吸烟会诱发癌症吗?虽然现在我们已经有了答案,但得出这个答案的过程却要比大多数人想象中的复杂许多。如果要求证一个科学假设,科学方法要求我们必须进行控制实验,也就是要有一个对照组,除了要求证的变量以外(如吸烟),实验组和对照组之间不能有任何不同。如果我们在这两组的观察结果中发现了明显的不同(如肺癌),那么我们就能完全推断这个变量是引起不同结果的原因。但是,我们不能以人为实验对象。如果我们的假设是吸烟能诱发癌症,那么就不能随便指定两组大学毕业生,将其分为吸烟组和不吸烟组,然后在20年后的同学聚会上打听谁得了癌症——这是不道德的。(如果我们的假设是某种新研制的药品或疗法或许能够改善人类健康,那么我们可以在人身上进行控制实验。我们不能在明知可能会带来不良后果的前提下以人为实验对象。)[②]
1702642616
1702642617
现在你或许会说,我们完全没有必要在一开始的时候就进行这项可能会违背伦理的实验。想观察吸烟所带来的影响?很简单,跳过这套令人头晕目眩的方法论,直接前往那群毕业生的20周年毕业聚会,去看看参加聚会的人数有多少就可以了。
1702642618
1702642619
不行。吸烟者和不吸烟者除了吸烟与否方面的不同,在生活的很多习惯方面都会有差异。比如,吸烟的人经常会有更多的嗜好,如酗酒和暴饮暴食,后两者也会给健康造成损害。就算在20周年聚会上那些吸烟者的健康状况尤其糟糕,我们也不能说这些都是吸烟造成的,也有可能是他们的其他坏习惯带来的。而且在数据的采集上我们也会遇到麻烦,要知道数据是我们作分析的依据,但那些吸烟的校友如果患上了严重的癌症,极有可能会缺席20周年聚会(已经离世的吸烟者就更不可能在聚会上露面了)。因此,由于那些健康状况良好的校友是最有可能出现在聚会上的,任何基于出席者健康状况的分析和推断(吸烟或其他变量)都会是有缺陷的,而且距离毕业的时间越长,比如40年或50年,这种缺陷就越严重。
1702642620
1702642621
我们不能像对待实验室里的小白鼠那样对待同胞,因此,统计学更像是侦探们做的事。数据里隐藏着线索和模型,沿着这些线索和模型,我们最终能够得到有意义的结论。就像那些让人印象深刻的罪案调查类美剧,如《犯罪现场调查:纽约篇》,剧中展现有魅力的警探和取证专家不放过丝毫细微的证据——烟蒂上的DNA、苹果上的咬痕、车座脚垫上的一根纤维,然后再根据这些证据顺藤摸瓜地抓住凶残的罪犯。这部剧最吸引人的地方就在于,里面的专家们并不是通过那些常规的证据,如目击证人、监控录像等来抓坏人的,而是借助了科技手段。统计学基本上也是干这些事情,凌乱无章的数据就像是犯罪现场,统计分析员就是警探,通过对原始数据进行分析和加工得到有意义的结论。
1702642622
1702642623
在读完本书第11章的内容之后,我希望你会对《犯罪现场调查:回归分析》产生兴趣,因为这部“美剧”与其他类似的动作警匪剧有一点儿不同。回归分析是研究者用来分割某两个变量之间关系的工具,如吸烟和癌症,但同时又要保证其他重要因素及其影响不变,如饮食、运动、体重等。如果你在报纸上读到每天吃一个麸皮饼可以减少结肠癌的发病概率,你完全不需要杞人忧天地想象着有一群不幸的人被关在联邦实验室的某个地下室,每天被强迫着吃下麸皮饼,而在隔壁大楼里的控制组则可以享用到培根和煎蛋。事实上,实验人员会对数以千计的人进行详尽的信息收集,包括他们吃麸皮饼的频率,然后用回归分析的方法来完成两个关键步骤:(1)量化吃麸皮饼和患结肠癌之间的关系(例如,在其他影响癌症发病率的因素完全相同的情况下,吃麸皮饼的人患结肠癌的发病率要比不吃麸皮饼的人低9%),(2)量化吃麸皮饼和结肠癌发病率下降之间的关系只是巧合的概率(如果真的成立,则否定了上述关于饮食和健康之间关系的发现,这对于该实验来说无疑是一个逆转)。
1702642624
1702642625
当然,《犯罪现场调查:回归分析》里的主演们都是俊男美女,比现实生活中处理这些数据的学者们要赏心悦目得多。这些俊男美女(所有人看上去都只有二十三四岁,但都惊人地获得了博士学位)会对大量数据进行分析,通过使用最先进的统计学工具来回答重要的社会问题:什么是打击暴力犯罪最有效的武器?
1702642626
1702642627
哪些人最有可能成为恐怖分子?在本书随后的内容里,将会为大家介绍一个概念——“具有统计学意义的”发现,也就是说,通过分析发现某两个变量之间的联系并不只是单纯的巧合。对于学术研究人员来说,这类发现在统计学上就代表“确凿的证据”。在那部美剧中,我看到一名研究人员在计算机实验室里“挑灯夜战”(因为白天的她作为沙滩排球队的队员代表美国队参加奥运会),在这名研究员把统计分析结果打印出来之后,她终于找到了一直以来孜孜以求的结论:.在她的数据集合里,有一个她认为可能会是非常重要的变量与自闭症之间有着“具有统计学意义的”联系。她必须马上与同事们分享这一重大突破!
1702642628
1702642629
这位研究人员拿着那页纸飞奔到大厅,但由于她穿着高跟鞋和一件过于紧身的黑色短裙,所以速度稍微受到影响。她跑到了她的男朋友的面前——一个身材健硕、皮肤晒得黝黑的帅哥,对于一个需要在地下实验室里每天工作14个小时的人来说,他是怎么做到如此健康的呢?这名研究人员把统计结果拿给她的男友看,他轻轻捋了捋下巴上修剪得整整齐齐的山羊胡,从抽屉里拿出一把格洛克18型全自动手枪,插人位于腋下的手枪套里,理了理身上价值5000美元的波士西装(我又忍不住想问一句,对于一个起始年薪才3.8万美元的年轻人来说,这身西服是不是贵了一些?)。随后,这两位回归分析专家迅速走近他们的上司——一位刚刚经历了失败婚姻和戒酒的年迈老兵……
1702642630
1702642631
好吧,有这么精彩的情节铺垫,难怪大家能意识到上述统计研究的重要性,但其实就算没有电视剧编剧的努力,统计研究本身也应该是精彩万分的。所有我们关心的社会挑战都少不了对大量数据集合的系统性分析(在很多时候,相关数据的收集是非常耗费财力和时间的工作,但在分析的过程中又起到了非常关键的作用,有关这一点会在第7章的内容中讲到)。刚刚关于《犯罪现场调查:回归分析》这部美剧的描述,我或许会对剧中的人物有所修饰,但对他们所要面对的那些问题的重要性,我是一点儿都不夸张的。有一篇学术文献就是以恐怖分子和“人肉炸弹”为主题的,而这类课题要是直接以人(或实验室老鼠)作为研究对象,是很难获得有用的结论的。我所在研究生院的一位统计学教授写了一本书,叫作《恐怖分子从何而来?》,该书对全球的恐怖主义袭击进行了数据统计,得出的结论之一是:恐怖分子不是极端贫困的人,受教育程度也不低。这位普林斯顿大学的经济学家阿兰·克鲁格总结道:“恐怖分子通常来自受过良好教育的中产阶级或高收入家庭。”
1702642632
1702642633
这是为什么呢?好吧,这暴露了回归分析的一个局限所在。我们可以通过统计分析来确定两个变量之间的强烈联系,但却无法解释为什么存在着这样的联系,在某些情况下,我们也无法确定这种联系是否为因果关系,也就是说,不知道其中一个变量的变化是否真的能引起另一个变量的变化。在恐怖主义的例子中,克鲁格教授推测,由于恐怖分子的行动一般都带有政治目的,所以只有受过高等教育和家境殷实的人才有最大的动力去改变社会,这些人尤其忍受不了某些政府部门对自由的压制,从而走向恐怖主义。根据克鲁格教授的研究,在其他因素相同的前提下,恐怖活动频繁出现的国家往往是那些实行高压政策的国家。
1702642634
1702642635
以上的这个讨论又把我们带回了那个问题:学习统计学的意义是什么?意义并不是要去做数学计算题,或在朋友和同事面前炫耀你学到的高级统计技巧,而是通过学习知识来认清我们的生活。
1702642636
1702642637
统计数字背后的谎言与真相
1702642638
1702642639
即使是在最理想的情况下,统计分析也很少告诉我们“真相”。我们通常所能做的,只是用并不完美的数据来就事论事,因此,我们总会看到有一些态度严谨的学术爱好者不同意某些统计结果或推论,而最为基本的就是对需要解答的问题本身产生质疑。体育爱好者们对于谁是“史上最佳的棒球运动员”这一问题似乎永远都达不成共识,因为对于“最佳”二字从来就没有一个客观的定义。令人眼花缭乱的描述性数据可以从某些角度对这个问题进行回答,但总是无法给出一个令所有人都信服的最终答案。正如本书下一章即将讲到的,还有很多具有深刻社会意义的问题都成为上述挑战的牺牲品。美国中产阶级的经济健康到底出了什么问题?问题的答案取决于我们如何定义“中产阶级”和“经济健康”。
1702642640
1702642641
我们所能收集的数据以及所能进行的实验的种类总归是有限的。阿兰·克鲁格对于恐怖分子的研究也没有夸张到用几十年的时间对几千名年轻人进行跟踪,从而确定他们中的哪些人最后变成了恐怖分子,因为这根本就是不可能实现的。我们同样也不能创造出两个完全相同的国家,其中一个国家在政治上实行高压管制,而另一个没有高压政策,然后比较发生在这两个国家的自杀式爆炸数量的多少。即使允许我们在人身上进行大量的控制实验,想要成功也不是一件容易的事,况且哪来那么多的资金?针对我们之前所提出的那个有关祈祷是否能减少术后并发症的问题,研究人员专门对此进行了大规模的调查分析,在这个过程中耗费了整整24万美元(至于结果如何,请你耐心读到第13章就知道了)。
1702642642
1702642643
美国国防部前部长唐纳德•拉姆斯菲尔德有一句名言:“战争是为了与真实存在的敌人作战,而不是与假想敌作战。”不论你如何看待拉姆斯菲尔德的这句话(以及他对伊拉克战争的解读),我们在研究领域同样用得上这句话。我们运用最好的数据、理论和资源来进行统计分析,但这一过程并不等同于加法或除法,正确的技术不一定能够得到“正确的”答案,电脑也不一定比人脑更加准确和无懈可击,统计分析更像是完成一个警探所要干的工作(我可没有为《犯罪现场调查:回归分析》打广告的意思)。数据总是想要告诉我们一些信息,但是面对这些信息,聪明又诚实的人经常有不同的看法。
1702642644
1702642645
但谁告诉过你,只要是使用统计学的人就一定是聪明又诚实的呢?正如之前所述,本书是向1954年发行、销量超过百万的经典作品《统计数字会撒谎》致敬的。现实就是,你既可以用统计数字撒谎,也有可能因为统计数字而不小心犯错。无论是哪种情况,统计分析所包含的数学精度都会被亵渎。本书将会带你认识那些最常见的统计学方面的错误和曲解,这样你就不至于犯了错还被蒙在鼓里。
1702642646
1702642647
那么,让我们再次回到本章中反复出现的那个问题:学习统计学的意义是什么?
1702642648
1702642649
总结大量的数据。
[
上一页 ]
[ :1.7026426e+09 ]
[
下一页 ]