打字猴:1.701003368e+09
1701003368 X的奇幻之旅:在现实生活中发现数学思维之美 [:1701001377]
1701003369 X的奇幻之旅:在现实生活中发现数学思维之美 第23章 贝叶斯定理:辛普森杀死前妻的概率有多大?
1701003370
1701003371 你有没有做过这样的噩梦:马上就要期末考试了,你突然发现有一门课你从来没有上过,试卷的内容你一点儿也看不懂?这是学生的噩梦。而教授的噩梦与学生的噩梦正好相反,教授会梦见自己站在讲台上准备讲课,却突然发现要讲的内容自己一点儿也不记得了。
1701003372
1701003373 每次上概率课的时候,我就好像生活在这样的噩梦里。我自己做学生的时候从来没上过概率课,所以对我来说,给学生们上概率课既恐怖又有趣,就好像是在游乐园游玩时进“鬼屋”一样。
1701003374
1701003375 概率课上最能让我心跳过速的内容是条件概率:在发生事件B的前提下,发生事件A的条件概率是多少(即已知事件B发生,在此条件下事件A发生的概率是多少)?这个概念非常复杂,很容易就会把B发生的前提下A发生的条件概率,与A发生的前提下B发生的条件概率相混淆。这两个概念当然是不一样的,但是,需要集中注意力保持头脑清醒,才能搞清楚它们之间的区别。在举例之前,我们先考虑下面这个问题。
1701003376
1701003377 你打算外出度假一周,出发之前,你请一个粗心的朋友帮你给一棵“生病”的植物浇水。如果不浇水,这棵植物有90%的概率会死掉。但即使是用心浇水,这棵植物也有20%的概率会死掉。根据你的判断,这个粗心的朋友忘记浇水的概率是30%。
1701003378
1701003379 以上是本题的条件,本题的问题如下:
1701003380
1701003381 (a)你回来时,这棵植物还活着的概率是多大?
1701003382
1701003383 (b)如果你回来时发现植物已经死了,请问你的朋友没有浇水的概率是多大?
1701003384
1701003385 (c)如果你的朋友没有给植物浇水,你回来时发现植物死了的概率是多大?
1701003386
1701003387 虽然(b)问题和(c)问题听起来差不多,但是这两个问题是不一样的,答案当然也不一样。实际上,题目的条件已经告诉我们,“如果不给植物浇水,这棵植物有90%的概率会死掉”,所以问题(c)的答案是90%。但是,怎样利用这些条件求解出(a)和(b)问题的答案呢?
1701003388
1701003389 因为我对概率不大熟悉,所以一开始教这门课的时候,我主要追求稳妥:什么都按照书本来,像上面这种题目我就直接套用书本上的公式来解答。但是渐渐地,我发现有些学生不用贝叶斯定理也能解出这类题目。为了绕过繁杂的贝叶斯定理,这些聪明的同学用一种与贝叶斯定理的原理相同但却更加简单明了的方法来解答这类题目。
1701003390
1701003391 时光飞逝,我给一届又一届的学生讲授概率课。在这些聪明学生的启发下,我慢慢地发现了一套理解条件概率的更好的办法。贝叶斯定理看上去很令人迷惑,而这些学生教我的方法则完全顺应人的直觉。这个方法的窍门就是,不要去想抽象的概率、机会、百分比之类的概念,而是直接考虑事情发生的次数(显然,这是一种更为自然的频率计算法,也可称为事件的“自然频率”)。只要转变思路,一切就都豁然开朗了。
1701003392
1701003393 就职于柏林马克思·普朗克人类发展研究所的认知心理学家捷尔德·盖格瑞泽写了一本非常有意思的书,书名为《风险的计算》。在这本书中,盖格瑞泽举出了很多他在研究中发现的人类对风险和不确定性的误判和错误计算。算错概率的例子遍及各个领域:从艾滋病治疗到脱氧核糖核酸(DNA)指纹图谱的识别。虽然我们计算概率的时候常常错得离谱儿,但是这位仁慈的心理学家并没有责骂我们的愚蠢,也没有哀叹人类的脆弱,他只是耐心地告诉我们怎样才能减少这类错误。盖格瑞泽的方法和我的学生们发明的方法差不多,那就是,当面对条件概率问题的时候,不使用抽象的概率和百分比,而是依赖最自然、最原始的计数方法:计算事件发生的次数(自然频率)。
1701003394
1701003395 在其中一项研究中,盖格瑞泽和他的同事请德国和美国的医生们来解答这样一个问题:如果一位妇女的乳房X射线检查结果呈阳性,但是这位妇女又属于乳腺癌发病风险较低的人群(年龄在40~50岁,无家族乳腺癌病史,本人无乳腺癌症状),那么她罹患乳腺癌的概率到底有多大?为了把问题进一步具体化,盖格瑞泽给受访的医生们提供了如下信息:一是这个人群中乳癌的发病率,二是乳房X射线检查的灵敏度和阴性被误判为阳性的概率。这些信息都是以概率和百分比的形式给出的,具体数据如下:
1701003396
1701003397 在年龄为40~50岁、无家族乳腺癌病史、本人无乳腺癌症状的妇女中,乳腺癌发病率是0.8%。如果一位妇女确实患有乳腺癌,那么乳房X射线检查呈阳性的概率是90%。如果一位妇女没有患上乳腺癌,但乳房X射线检查结果呈阳性的概率为7%。现在,有一位妇女,她属于乳腺癌发病风险较低的人群,但是她的乳房X射线检查结果呈阳性,请问她实际患有乳腺癌的概率是多少?
1701003398
1701003399 盖格瑞泽询问的第一位医生是一所大学附属医院某部门的主任,对于乳腺癌的诊断,这位医生有着超过30年的专业经验。根据盖格瑞泽的描述,这位医生对上述问题的反应是这样的:
1701003400
1701003401 我提出这个问题以后,这位医生显得很紧张,他很努力地想要算出正确的数值。在仔细研究过我给出的数据以后,这位医生判断,在乳房X射线检查结果呈阳性的前提下,这位妇女实际患有乳腺癌的概率是90%。回答完这个问题以后,这位医生又立刻推翻了自己的答案,他紧张地说:“我肯定搞错了,我根本不会算。你应该去问我的女儿,她正在医学院读书。”显然,这位医生很清楚自己的答案是错误的,但是他却不知道怎么才能算对。虽然他对这个问题冥思苦想了足有10分钟,但他却根本不清楚应该怎样使用概率。
1701003402
1701003403 同样的问题,盖格瑞泽又询问了24位德国医生,这些医生给出的答案五花八门。有8位医生认为,这位妇女实际患有乳腺癌的概率应该为10%或者更低;另有8个医生认为,这位妇女实际患有乳腺癌的概率是90%;剩下的8名医生认为,这位妇女实际患有乳腺癌的概率为50%~80%。想象一下,如果你是一位病人,听到这些结果不一的诊断意见,你的心里会有多么痛苦。
1701003404
1701003405 那么,美国医生的表现又如何呢?85%的受访医生认为,该妇女罹患乳癌的概率应该约为75%。
1701003406
1701003407 其实,这道题的正确答案是9%。
1701003408
1701003409 为什么这位妇女实际患乳癌的概率这么低?盖格瑞泽指出,只要把题目的说法从概率和百分比“翻译”成事件发生的次数,这道题就会变得非常简单。具体翻译如下:
1701003410
1701003411 在年龄为40~50岁、无家族乳腺癌病史、本人无乳腺癌症状的每1 000位妇女中,就会有8人罹患乳腺癌。这8个人中有7个人的乳房X射线检查结果呈阳性。在没有患上乳腺癌的992人中,大约有70人的乳房X射线检查结果会错误地显示为阳性。现在有一个乳房X射线检查结果呈阳性的妇女,请问她实际患有乳腺癌的概率是多少?
1701003412
1701003413 非常简单。1 000人中检查结果呈阳性的一共有7+70=77个人。这77个人中,只有7个人确实是乳腺癌患者,剩下的70人并没有患上乳腺癌。所以,在检查结果呈阳性的前提下,实际患有乳腺癌的概率是7除以77,也就是1/11或者约9%。
1701003414
1701003415 在上面的计算中,我们做了两处简化。
1701003416
1701003417 第一,我们把所有小数四舍五入为整数。比如,“这8个人中有7个人的乳房X射线检查结果呈阳性”。准确地说,8个患乳腺癌的人乳房X射线检查结果呈阳性的概率为90%,也就是说有8×0.9=7.2个人乳房X射线的检查结果呈阳性。此处,我们把7.2直接四舍五入为7,虽然精确度有所下降,但是整数会比小数更清楚易懂。
[ 上一页 ]  [ :1.701003368e+09 ]  [ 下一页 ]