1701557939
1701557940
1.1.p(你已经患病|检查结果为阳性)
1701557941
1701557942
这种结构更方便,因为它可以提示我们这句话的前半部分——符号“|”之前的为分数的分子,符号“|”之后的为分母。
1701557943
1701557944
为了回答第一个问题,我们只看检查结果为阳性的那一列,即左列。201个检查结果为阳性的人中,只有1人真的患病。那么问题1的答案为1/201,也就是0.49%。
1701557945
1701557946
问题2.如果你已经患病,那么你的检查结果为阳性的概率为多少?
1701557947
1701557948
2.1p(你的检查结果为阳性|你已经患病)
1701557949
1701557950
现在,我们看着顶上的一行,构建分数1/1得出结果,如果你真的确实已经患病,你的检查结果为阳性的概率为100%。
1701557951
1701557952
你一定还记得我虚拟的药物——chlorohydroxelene,它的副作用概率为20%。我们将每一个检查结果为阳性的人——他们中的201人——20%或者40,视为可能会存在药物副作用的人。记住,只有1个人确实已经患病,所以药物副作用的概率要比疗效的概率大40倍。
1701557953
1701557954
在第6章我所谈到的两个案例——模糊症和蓝脸症中,即使你的检查结果为阳性,你也不一定已经患病。当然,如果你已经患病,选择正确的药物是尤其重要的。你应该怎样做呢?
1701557955
1701557956
你可以检查两次。在这里,我们将运用概率的乘法法则,假定检查的结果是独立的。也就是说,不管任何可能导致你得到不正确结果的错误都是随机的——它跟实验室里的人已经决定了这里面有你不一样——所以,如果你曾经得到过一个不正确的结果,你再一次得到错误结果的概率也不会降低。回想一下,我曾经说过检查的错误率为2%。那么,连续两次错误的概率为2%×2%,或0.0004。如果你喜欢用分数,那么概率为1/50,1/50×1/50=1/2500。但即使这项统计,也没有考虑到基础概率:这是一种罕见的疾病,而这才是我们这节附录所要讲述的重点。
1701557957
1701557958
当然,对我们有帮助的事情是构建一个能够回答“如果我连续两次检查结果都为阳性,那么我患病的概率为多少”这一问题的四格表。
1701557959
1701557960
当我们开始审视模糊症的时候,我们有一大堆数字,然后将其填入四格表;这让我们可以更好地计算出已经更新的概率。贝叶斯推理的其中一个特征是,你可以将已经更新的概率放入新的表格,然后再更新。随着不断更新信息,你可以构建新的表格,得出更准确的估算。
1701557961
1701557962
当我们将数字都输入表格之后,我们得到了这样的表格:
1701557963
1701557964
附录表11 填入连续两次检查都是阳性数据后的四格表
1701557965
1701557966
1701557967
1701557968
1701557969
从表格中,我们得知:
1701557970
1701557971
检查结果为阳性的人数为:201;
1701557972
1701557973
检查结果为阳性且患病的人数:1;
1701557974
1701557975
检查结果为阳性且未患病的人数:200。
1701557976
1701557977
我们需要注意,现在我们只看到了表格的一半:检查结果为阳性的那一半。这是因为我们想要回答的问题:假设你的检查结果为阳性,如果我连续两次检查结果都为阳性,那么我患病的概率为多少?
1701557978
1701557979
现在,我们用这些信息构建一个新的表格。第二次检查的结果可能为阳性,也可能为阴性,你可能已经患病,也可能并未患病。我们不再需要看总人数10000,我们只需要看10000人中第一次检查结果为阳性的人——201人。所以我们将201填入右下角。
1701557980
1701557981
附录表12 填入第二次检查结果为阳性人数后的四格表
1701557982
1701557983
1701557984
1701557985
1701557986
从上面的已知信息中,我们还可以填入一些其他信息。我们知道已患病与未患病的人的数量,所以我们可以填完表格右侧。
1701557987
1701557988
附录表13 填充完整表格右侧数字后的四格表
[
上一页 ]
[ :1.701557939e+09 ]
[
下一页 ]