打字猴:1.701556433e+09
1701556433
1701556434 我们感兴趣的许多事情都曾经发生过,所以我们才能经常估算出它发生的概率。事物的基础概率就是它出现的背景概率。我们中的大多数人都会有这种直觉:如果你的汽车发动机出现杂音,你将它送到维修厂,机械师可能看都没看就会说:“很可能是同步带出现问题了——我们遇到的情况中有90%都是这种问题;也可能是喷油嘴的问题,但喷油嘴几乎很少出错。”这位机械师使用的正是信息预测基本概率。
1701556435
1701556436 如果你被邀请参加苏珊家的某个聚会,聚会中有一大群你从未见过的人,与你最后谈话的人是医生而不是总统内阁成员的概率有多少?医生的数量显然多过内阁成员的数量。医生的基数更大,所以,如果你对这次聚会一无所知,肯定会猜测在聚会上会遇见更多的医生。同样,如果突然头痛或者感到焦虑,你也许会担心自己患上脑瘤。无法解释的头痛实际上是很常见的,但脑瘤不是。医学诊断上有这样的老生常谈:“当听到蹄声时,会想到是马的蹄声,而不是斑马的。”也就是说,当我们有某种症状时,不要忘记基础概率。
1701556437
1701556438 认知心理学试验已经告诉我们,做出判断和决定的时候,我们通常会遗忘基数,反而会相信医学术语。在苏珊的聚会上,如果与你谈话的人衣服上有美国国旗翻领胸针,很懂政治、被美国特工处追踪,那么你会认为她是一位内阁成员,因为她拥有内阁成员的所有特质。但是你忘了基础概率。全美一共有85万名医生,但仅仅只有15位内阁成员。在这85万名医生中,一定会有人佩戴美国国旗翻领胸针、懂政治,甚至出于某种原因会被美国特工处追踪。例如,第111次国会的时候,内阁成员中有16位医生——比内阁成员中其他职业都要多。还有一些医生在军队、联邦调查局、中央情报局工作,肯定会有医生的配偶、父母、孩子是高级公务员——其中的某些人需要采取保密措施。85万名位医生中,可能有人需要安全许可,或者出于某种原因牵涉到特工处,从而需要参与调查。这种推理错误是如此的根深蒂固,它甚至有个名字——代表性启发法。它的意思是某些有代表性的人或情形会有效压倒我们大脑的推理能力,让我们忽视数据或基数信息。
1701556439
1701556440 在某篇论文的经典试验中,你需要阅读某个场景。你被告知,在某个特定的大学,10%的人是工程师,90%的人不是工程师。你参加一个聚会,看见某人穿着塑料防护服(不用说,许多人都认为这种打扮是工程师的典型形象),你被要求猜测那个人是否是工程师。许多人都认为他是工程师。防护服是如此典型,确凿证据,很难让人想到那个人会从事其他职业。但我们需要考虑这样一个事实:这所大学很少有工程师。也许这个人是工程师的概率不会与基础概率一样低——10%,但它肯定也不会有100%那么高——其他人也会穿防护服。
1701556441
1701556442 这就是有趣的地方。研究者然后设置了相同的情形——一所大学的聚会中,10%的人都是工程师,90%的人都不是工程师——然后试验人员解释道:“你会遇见某个穿防护服的人,也可能遇见某个不穿防护服的人,但是你无法分辨他们,因为他们都穿着夹克。”当试验人员要求猜测某个人是否为工程师时,测试者通常会说“一半一半”。被问及原因时,他们回答说,“他也许穿着防护服也许没有——我们不知道。”这里,人们再一次犯了将基础概率考虑进去的错误。如果你对那个人一无所知,那么他是工程师的概率为10%,而不是50%。只有两种选择并不意味着这两种选择出现的概率是相同的。
1701556443
1701556444 再举一个更直观清晰的例子。想象一下你在家附近的超市散步,突然撞上某个人。她可能是伊丽莎白女王也可能不是。但她是伊丽莎白女王的概率有多大呢?大多数人都不会认为这是一半一半。女王出现在超市的概率有多大?更不用说她是我们所撞见的那个人。当可能性较小的时候,我们的大脑会打结。做决策需要我们将基础概率信息与其他相关诊断信息结合。这种类型的推理由数学家兼长老派牧师托马斯·贝叶斯发现,因此以他的名字命名:贝叶斯定理。
1701556445
1701556446 贝叶斯定理让我们得以修正预测。例如,我们读到“大致一半的婚姻最终都会离婚”,如果我们了解更多信息,例如年龄、宗教、涉及人群的位置,我们就可以修正预测,因为一半的数据都是针对某个群体的,一些地区的离婚率肯定高于其他地区。
1701556447
1701556448 还记得那个有10%的工程师、90%非工程师的聚会吗?一些其他信息可以帮你预测某个穿防护服的人是否为工程师的概率。也许你知道聚会的主人与某个工程师已经绝交,她不会再邀请工程师;也许你知道医科大学预科学生中50%都会穿防护服。这样的信息能让我们用新的信息更新原始基础概率。定量更新后的可能性是贝叶斯定理的一种应用。
1701556449
1701556450 我们不会再问简单的、单一的问题:“身穿防护服的人是工程师的概率为多少”;相反,我们会问更复杂的问题:“在已知医科大学预科学生中50%都会穿防护服的情况下,身穿防护服的人是工程师的概率为多少”。工程师的罕见与防护服的特殊性之间有着某种冲突。
1701556451
1701556452 我们可以简单地将医学问题升级为:“三天之前我曾经接触过患流感的人,那么我现在喉咙痛预示已经患上流感的概率为多少呢”,或者“我在花粉季节出门,那么我现在喉咙痛预示我感染花粉热的概率为多少呢”。我们会在大脑中进行这种更新,但仍然有一些工具可以帮助我们对新信息进行定量分析。解决这一问题的关键在于我们的大脑无法自动生成正确的答案。我们的大脑已经进化到可以解决一部分问题,但贝叶斯问题仍然存在。
1701556453
1701556454 哦,不!我的检查结果为阳性
1701556455
1701556456 这样的消息有多严重?这种问题,如果采用我在学校学到的戏法——四格表(也称为情形分析表)来解决的话,事情就变得简单多了。这不是运用直觉或预感就能简单解决的问题。假设某一天早晨你醒来的时候发现自己视力模糊。我们进一步假设,有一种很罕见的疾病叫作光学模糊。在美国,一共只有38000名这样的患者,也就是说基础概率为1/10000(38000∶3800000000)。你刚刚才知道这一点,现在就开始害怕起来。你开始思考,究竟是什么样的原因让你突然视力模糊呢?
1701556457
1701556458 你做了一个模糊的血液样本检查,结果显示为阳性。你和你的医生试着搞清楚下一步应该怎么办。这里有一个问题,治疗模糊症的一种名为chlorohydroxelene的药物,有5%的概率会产生严重副作用,包括背部可能产生的严重的、不可逆转的瘙痒(你可以吃药治疗瘙痒,但证据表明,这种药有80%的概率会造成你的血压升高)。5%也许不是一个很大的概率,你也许会打算服用药物治疗视力模糊(5%属于第一种客观可能性——不属于主观猜测,而是从上万份药物服用记录中得出的概率)。很自然地,在使用这种药物、冒着患上瘙痒症的风险之前,你会想要进一步了解自己患上这种疾病的概率为多少。
1701556459
1701556460 四格表可以帮助我们列出信息,这种方法很容易得出结论。如果这些数字和分数让你想从房间里冲出去尖叫,请不要担心——附录包括了一些细节。这一章将会为我们大概介绍一下(也许是一个模糊视角,但毕竟,你现在正表现出模糊症的症状)。
1701556461
1701556462 看看我们已经了解到的信息:
1701556463
1701556464 •模糊症的基础比例为万分之一或者0.0001;
1701556465
1701556466 •使用chlorohydroxelene产生副作用的概率为5%,或0.05。
1701556467
1701556468 你也许会认为,如果结果为阳性,那么你已经患上了这种病。但检查并不是这样的——大多数检查都是不完美的。现在你已经对贝叶斯思维有所了解,你也许会问一些更精确的问题:“当结果为阳性的时候,我患上这种病的概率为多少?”记住,基础概率告诉我们,随机选择一些人,这些人患上这种病的概率为0.0001。但你不是那些随机选择的人。你的视力确实模糊,你的医生也为你做了检查。
1701556469
1701556470 我们需要处理更多信息。我们需要知道检查结果不准确的概率为多少。检查结果可能会从两个方面发生错误:一是你已经患上了这种病,你得到——错误的阳性;二是你没有患上这种病,你得到——错误的阴性。我们暂时认为这些数字的概率都为2%。在现实生活中,这些数字可能会有所不同,但我们暂且认为每个概率都为2%。
1701556471
1701556472 我们开始画一个四格表,然后按照如下方式标记它们:
1701556473
1701556474 表6–1 检查结果四格表
1701556475
1701556476
1701556477
1701556478
1701556479 我们先暂时不管这些结果是否准确——我们仅仅展示怎么运用这个表格得出结论。表头显示出某个特定患者要么已经患上某种疾病,要么没有。每个方格都代表了表头与竖行的交集。我们看到,在患上该疾病的人中,某些人结果为阳性(左上角方格),某些人为阴性(右上角)。对于诊断结果为没有患病的那一列也同样是这样:某些人结果为阳性,某些人为阴性。你会希望即使你的测试结果为阳性(左上角方格),你也同样没有患上疾病(左下角)。
1701556480
1701556481 将已知的信息填充进去之后(我会在附录中具体展示),我们就可以问这个问题:“当结果为阳性的时候,我患上这种病的概率为多少?”
1701556482
[ 上一页 ]  [ :1.701556433e+09 ]  [ 下一页 ]