打字猴:1.702637342e+09
1702637342 例7 癌症群
1702637343
1702637344 1997~2004年,在内华达州法伦的一个住有8600人的农场(该农场距离雷诺市60英里),16个儿童被诊断出患有癌症,后来有3人死亡。对于这个小镇来说,这个数字很不寻常。当地住户担心法伦水源中三氧化二砷含量超标,怀疑通往当地海军基地的柴油管道、本地喷洒的杀虫剂、钨含量或大约40年前在30英里外所做的地下核爆实验可能与此有关。然而,科学家没有发现这些因素与癌症之间有任何关系,当地居民对科学家非常失望。
1702637345
1702637346 1984年,马萨诸塞州兰道夫镇在250个居民中发现了67例癌症病例。这个癌症群看上去很不寻常,居民怀疑附近一家化工厂的排放物污染了水源并导致人们患癌症。
1702637347
1702637348 1979年,该州沃本镇的8口井中,经发现有两口井遭到了化学污染。感到忧虑的居民开始清点癌症病例,1964~1983年,共发现了20个儿童白血病病例。这个数字很不正常,居民相信是井水导致了白血病,并起诉两家公司对于水源污染负有责任。
1702637349
1702637350 癌症是一种普遍的疾病,在美国癌症死亡率超过23%。有时,癌症病例会在邻近区域内密集发生,这不算稀奇,总有“某个”地方因为巧合而出现多个癌症病例。可是当癌症群出现在“我们”邻近的区域时,我们就会往坏的方面想,想找某个人来承担责任。美国各州政府每年都会接到几十个老百姓打来的电话,担心他们住的地区“有太多癌症”。但是,正如美国国家癌症研究所说的那样:“大部分的癌症集中情况,不过是巧合罢了。”
1702637351
1702637352 对马萨诸塞州的两个癌症群,哈佛大学公共卫生学院的统计学家都进行过调查。调查人员试着取得曾在问题发生期间住在该区域的每一个人的完整资料,并估计每一个人和可疑饮水的接触程度。调查人员也试图取得其他可能的致癌因素的相关资料,例如吸烟与否,以及在工作时是否会接触有毒物质。最后的结论是:对兰道夫镇的癌症群而言,最可能的解释是巧合;但有证据显示,沃本镇的被污染的两口井和儿童患白血病之间有相关关系。
1702637353
1702637354 平均律的神话
1702637355
1702637356 有一次,我在拉斯韦加斯赌场漫步,眼看着钱从赌桌上落入赌桌下的盒子里。你在赌场里会看到有趣的人类行为:当掷色子的人连赢几把的时候,有些赌徒会认为她“手风正顺”,打赌她还会继续赢;其他人却说,根据“平均律”(law of averages),她应该会输,这样输赢才能平衡。笃信平均律的人认为,如果你抛硬币6次并得到“反反反反反反”的结果,下一次一定是正面朝上的概率比较大。长期来说,正面朝上的比例的确应该占一半。所谓的神话是指,认为像连续出现6次反面朝上的不平衡状况,会在下一次的结果中得到纠正。
1702637357
1702637358 硬币和色子没有记忆。硬币不知道前6次的结果都是反面朝上,不能在下一次想办法得到一个正面朝上的结果来纠正不平衡。当然,长期下来真的会达到平衡。在抛了10000次以后,前6次的结果就无足轻重了,但不是被“纠正”,而是被后来抛的9994次的结果淹没了。
1702637359
1702637360 例8 我们想生一个男孩
1702637361
1702637362 相信这个假的“平均律”,有可能导致近乎灾难的结果。几年前,“亲爱的艾比”这个提供建议的专栏,刊登了一个心烦意乱的母亲的信,她一连生了8个女儿。她和她的丈夫本来打算要4个孩子,可是当4个女儿出生后,他们又继续尝试。在第7个女儿出生后,就连她的医生都向她保证:“根据平均律,你下一次生下男婴的机会是100∶1。”不幸的是,这对夫妇生孩子就像抛硬币一样,在已经有了7个女儿之后,下一个还是女孩的概率并没有减小,而且实实在在地发生了。
1702637363
1702637364 什么是平均律
1702637365
1702637366 世界上存在“平均律”吗?是的,尽管有时它被称为“大数定律”(law of large numbers)。它指的是大量独立存在的随机现象在重复发生的过程中(比如抛硬币),平均数或比例有可能随着次数增加变得更稳定,而总和或计数可能变化更大。对坏运气做出补偿,这种情况不会发生,因为“独立”的意思是知道一次的结果,并不会改变其他结果的发生概率。
1702637367
1702637368 图17-1和17-3展示了我们多次抛一枚硬币的情况。在图17-1中,我们看到正面朝上的比例随着抛掷次数增加,会越来越接近0.5。这就是大数定律。然而,我们从图17-3上可以看到,随着抛掷次数增加,正面朝上的总次数的变化越来越大。所以,大数定理不适用于总和或计数。
1702637369
1702637370
1702637371
1702637372
1702637373 图17-3 多次抛一枚硬币,正面朝上的次数与抛掷次数的一半之差会随着抛掷次数的增加而变大
1702637374
1702637375 我们不时看到用平均律表述总和或计数的错误做法,而不是用平均值或比例表述。例如,假设在美国男孩和女孩的出生概率是相等的,你可能会听到有人说美国的男女性总人数也大致相等,而不是男女性所占比例几乎相等。
1702637376
1702637377 练习
1702637378
1702637379 17.2 抛硬币与平均律。作家C·S·刘易斯曾写道,根据平均律,如果你抛一枚硬币10亿次,你可以预测正面朝上和反面朝上的次数几乎相等。这是平均律的一种正确表述吗?如果不是,该如何改正?
1702637380
1702637381 个人概率
1702637382
1702637383 乔坐在那儿瞪着他的啤酒,他支持的棒球队芝加哥小熊队,刚刚又输了一场球。小熊队拥有一些很优秀的年轻球员,所以我们问乔:“明年小熊队打进大联盟冠军赛的概率有多大?”乔的眼睛亮起来了,他说:“噢,大概10%。”
1702637384
1702637385 是乔把小熊队打进大联盟冠军赛的概率设定为0.10吗?下一年的比赛结果当然是没法预测的,但若我们考虑重复多次会发生什么结果,又不大合理。明年的大联盟冠军赛只会发生一次,而且在球员、天气和其他许多方面都会和其他赛季不同。这个问题的答案似乎很清楚:如果概率度量的是“假如我们重复多次,会出现什么结果”,则乔说的0.10根本不是概率。概率是根据同一个随机现象重复多次而来的。乔给我们的不是概率,而是他的个人判断。
1702637386
1702637387 可是,当我们在使用“概率”这个词的时候,也常常包括了我们对于某个事件发生可能性的个人判断。我们还会根据这些判断做出决定,比如,我们乘坐公共汽车进城,是因为考虑到能找到停车位的机会很小。就连更重要的决定也会把对“机会有多大”的判断考虑在内。决定是否要建新厂的公司现在就必须判断,当三年后新厂盖好时,消费者对该公司产品有大量需求的机会有多大。许多公司把他们对“机会有多大”的判断,用数字表示并把它当成概率,还用于计算。三年后有大量需求,就像小熊队打进明年的冠军赛一样,都是“只此一次”的事件,没法“重复多次”。不仅如此,公司的每个高级主管给出的概率可能都不一样,反映出他们每个人的判断不同。因此,我们需要另外一种概率——“个人概率”(personal probability)。
1702637388
1702637389 个人概率
1702637390
1702637391 一个事件的个人概率是0~1之间的一个数字,代表个人对于该事件发生机会有多大的判断。
[ 上一页 ]  [ :1.702637342e+09 ]  [ 下一页 ]