1701556449
1701556450
我们不会再问简单的、单一的问题:“身穿防护服的人是工程师的概率为多少”;相反,我们会问更复杂的问题:“在已知医科大学预科学生中50%都会穿防护服的情况下,身穿防护服的人是工程师的概率为多少”。工程师的罕见与防护服的特殊性之间有着某种冲突。
1701556451
1701556452
我们可以简单地将医学问题升级为:“三天之前我曾经接触过患流感的人,那么我现在喉咙痛预示已经患上流感的概率为多少呢”,或者“我在花粉季节出门,那么我现在喉咙痛预示我感染花粉热的概率为多少呢”。我们会在大脑中进行这种更新,但仍然有一些工具可以帮助我们对新信息进行定量分析。解决这一问题的关键在于我们的大脑无法自动生成正确的答案。我们的大脑已经进化到可以解决一部分问题,但贝叶斯问题仍然存在。
1701556453
1701556454
哦,不!我的检查结果为阳性
1701556455
1701556456
这样的消息有多严重?这种问题,如果采用我在学校学到的戏法——四格表(也称为情形分析表)来解决的话,事情就变得简单多了。这不是运用直觉或预感就能简单解决的问题。假设某一天早晨你醒来的时候发现自己视力模糊。我们进一步假设,有一种很罕见的疾病叫作光学模糊。在美国,一共只有38000名这样的患者,也就是说基础概率为1/10000(38000∶3800000000)。你刚刚才知道这一点,现在就开始害怕起来。你开始思考,究竟是什么样的原因让你突然视力模糊呢?
1701556457
1701556458
你做了一个模糊的血液样本检查,结果显示为阳性。你和你的医生试着搞清楚下一步应该怎么办。这里有一个问题,治疗模糊症的一种名为chlorohydroxelene的药物,有5%的概率会产生严重副作用,包括背部可能产生的严重的、不可逆转的瘙痒(你可以吃药治疗瘙痒,但证据表明,这种药有80%的概率会造成你的血压升高)。5%也许不是一个很大的概率,你也许会打算服用药物治疗视力模糊(5%属于第一种客观可能性——不属于主观猜测,而是从上万份药物服用记录中得出的概率)。很自然地,在使用这种药物、冒着患上瘙痒症的风险之前,你会想要进一步了解自己患上这种疾病的概率为多少。
1701556459
1701556460
四格表可以帮助我们列出信息,这种方法很容易得出结论。如果这些数字和分数让你想从房间里冲出去尖叫,请不要担心——附录包括了一些细节。这一章将会为我们大概介绍一下(也许是一个模糊视角,但毕竟,你现在正表现出模糊症的症状)。
1701556461
1701556462
看看我们已经了解到的信息:
1701556463
1701556464
•模糊症的基础比例为万分之一或者0.0001;
1701556465
1701556466
•使用chlorohydroxelene产生副作用的概率为5%,或0.05。
1701556467
1701556468
你也许会认为,如果结果为阳性,那么你已经患上了这种病。但检查并不是这样的——大多数检查都是不完美的。现在你已经对贝叶斯思维有所了解,你也许会问一些更精确的问题:“当结果为阳性的时候,我患上这种病的概率为多少?”记住,基础概率告诉我们,随机选择一些人,这些人患上这种病的概率为0.0001。但你不是那些随机选择的人。你的视力确实模糊,你的医生也为你做了检查。
1701556469
1701556470
我们需要处理更多信息。我们需要知道检查结果不准确的概率为多少。检查结果可能会从两个方面发生错误:一是你已经患上了这种病,你得到——错误的阳性;二是你没有患上这种病,你得到——错误的阴性。我们暂时认为这些数字的概率都为2%。在现实生活中,这些数字可能会有所不同,但我们暂且认为每个概率都为2%。
1701556471
1701556472
我们开始画一个四格表,然后按照如下方式标记它们:
1701556473
1701556474
表6–1 检查结果四格表
1701556475
1701556476
1701556477
1701556478
1701556479
我们先暂时不管这些结果是否准确——我们仅仅展示怎么运用这个表格得出结论。表头显示出某个特定患者要么已经患上某种疾病,要么没有。每个方格都代表了表头与竖行的交集。我们看到,在患上该疾病的人中,某些人结果为阳性(左上角方格),某些人为阴性(右上角)。对于诊断结果为没有患病的那一列也同样是这样:某些人结果为阳性,某些人为阴性。你会希望即使你的测试结果为阳性(左上角方格),你也同样没有患上疾病(左下角)。
1701556480
1701556481
将已知的信息填充进去之后(我会在附录中具体展示),我们就可以问这个问题:“当结果为阳性的时候,我患上这种病的概率为多少?”
1701556482
1701556483
表6–2 填入信息后的四格表
1701556484
1701556485
1701556486
1701556487
1701556488
让我们一块来看看那些结果为阳性的人的数据:
1701556489
1701556490
表6–3 检查结果为阳性的人的数据
1701556491
1701556492
1701556493
1701556494
1701556495
你可以看到,在1万个人中,有201个人(左侧一栏总和)都有跟你一样的阳性结果。但在201个人中,只有一个人真正患病—你只有1/201的概率患上这种病。我们可以用1/201×100%来计算百分比,得到0.49%—这个概率并没有你想得那么高……在你做检查之前,你的患病概率为万分之一;现在概率是1/201,你有大约99.51%的概率没有患上这种疾病。这应该能让你想到我们之前所讲到的中彩票的概率。你的思路已经发生了巨大转变,但这没有以一种有效的方式影响实际结果。检查结果并没有告诉你所需要知道的所有信息。将结果拿回家之后你需要做的事情是运用基础概率以及错误概率信息来帮助我们搞清楚状况。这就是四格表的用途。即使在患病过程中某些症状减弱,例如视力模糊症状减弱,或者一些其他症状减弱,例如无力状态减弱,这些都不重要;四格表可以帮助你以一种易懂的方式组织所有信息。理想状态下,你还需要与医生一块合作考虑其他并发症、并存症状、家族病史,以做出更准确的预测。
1701556496
1701556497
让我们再来看另一条信息:可以治愈模糊症的神奇药物——chlorohydroxelene。这种药物有20%的概率会产生副作用(实际上20%的副作用概率对真正的药物来讲,也不算很反常)。如果服用这种药物,你需要权衡这1/5患上后背瘙痒症的可能,以及那1/201的治愈病情的概率。也就是说,如果201个人服用这种药物,只有1个人会治愈(因为其他服用这种药物的人根本就没有患病呀!)现在,服用药物的201个人中,20%的人,40个人,会出现副作用。服用药物的40人会患上后背瘙痒症,但实际上只有1个人治好了。因此,如果你服用这种药物,产生副作用的概率比治愈的概率高出40倍。不幸的是,这些数字都是美国卫生部门中很常见的数字。我们还会好奇,开销是否会大到不受控制?
1701556498
[
上一页 ]
[ :1.701556449e+09 ]
[
下一页 ]