打字猴:1.701026541e+09
1701026541
1701026542 如果我们失去信心,绝望地说:“所有事物之间都存在相关性!”那么,这样的结论没有多大意义。因此,我们不会报告我们发现的所有相关性。如果报告某两个事物之间存在相关性,就是在暗示读者这种相关性“非常强”,值得报告,而且通常是因为该相关性通过了统计学显著性检验。我们知道,统计学显著性检验会招致很多风险,但是我们至少可以借此发出一个信号,让统计学家觉得“这中间肯定有某种玄机”而不敢等闲视之。
1701026543
1701026544 但是,到底有什么玄机呢?接下来讨论的是最麻烦的问题。已婚与吸烟之间存在负相关关系,这是一个事实,用一句的话来表述就是:
1701026545
1701026546 如果你吸烟,你已婚的可能性就比较低。
1701026547
1701026548 但是,如果对这句话稍加改动,意思将截然不同:
1701026549
1701026550 如果你曾经吸烟,你已婚的可能性就比现在低。
1701026551
1701026552 将陈述语气变成虚拟语气之后,句子的意思竟然发生了如此明显的变化,似乎让人摸不着头脑。第一句话表述的是真实情况,而第二句话则涉及一个更加微妙的问题:如果我们改变现实世界中的事物,将会产生什么结果?第一句话表示某种相关性,而第二句话则暗示某种因果关系(曾经吸烟会导致现在已婚的可能性降低)。我们已经讨论过,相关关系与因果关系是不同的概念。吸烟者已婚的可能性低于其他人,这个事实并不意味着戒烟之后你的未来伴侣就会从天而降。自从一个世纪之前高尔顿与皮尔逊完成了他们的研究之后,对相关性的数学描述就固定下来了,而且这些描述非常到位。但是,因果关系这个概念却一直令人困惑。
1701026553
1701026554 我们对相关关系与因果关系这两个概念的理解在某些方面含糊不清。有时候,我们可以凭直觉清楚地发现两者之间的不同,但是直觉有时候也无能为力。我们说优质胆固醇含量与心脏发病率之间存在相关性,我们表述的是这样一个事实:“如果你的优质胆固醇含量较高,你患心脏病的可能性就比较小。”我们很可能会认为优质胆固醇可以发挥某种作用,从而改善心血管健康状况,比如,可以“刮掉”动脉壁上讨厌的油脂。也就是说,如果优质胆固醇真的有益身体健康,那么我们的确有理由认为,所有能提高优质胆固醇含量的治疗方法,都可以降低人们患心脏病的风险。
1701026555
1701026556 但是,优质胆固醇与心脏病之间存在相关性的原因与我们想象的可能有所不同。比如,某个我们还没有发现的因素在提升优质胆固醇含量的同时,还能降低心血管疾病的发病风险。在这种情况下,能提高优质胆固醇含量的药物有可能具有预防心脏病的疗效,也可能没有。如果这种药物是通过作用于这个神秘因素来提高优质胆固醇含量的,就可能对心脏有益;如果这种药物是通过其他方式提高优质胆固醇含量的,我们的希望就会完全落空。蒂姆与萨拉的收益情况与之相似。他们在理财上取得的成功具有相关性,但是,萨拉的盈亏不是由蒂姆的收益决定的,而是另有原因,即同时影响蒂姆与萨拉收益的那个神秘因素——本田公司的股票。在临床上,研究人员把这个现象称作“替代终点问题”(surrogate endpoint problem)。要检验某种药物是否具有延年益寿的效果,需要投入大量时间与资金,因为我们必须等到人们死了之后才能知道他们的寿命。优质胆固醇就是一种理想的替代终点,人们认为这种易于检验的生物标记物是“寿命长、无患心脏病风险”的标志。但是,优质胆固醇与心脏病之间存在相关性,可能并不代表两者之间也存在因果关系。
1701026557
1701026558 甄别相关性是否由因果关系产生,其难度非常大。即使在某些情况下,我们可能觉得两者有明显的区别,例如吸烟与肺癌之间的关系,但是,要清楚地区分它们也是一件令人头疼的事。19世纪末20世纪初,肺癌还是一种极为少见的疾病。但是到了1947年,在因癌症死亡的英国人中,有1/5的人死于肺癌,是几十年前肺癌死亡人数的15倍。起初,很多研究人员认为这是因为肺癌的诊断水平比以前更高,但是,人们很快发现,从肺癌病例数量增长的速度之快、幅度之大来看,这样的解释是说不通的。人们只知道肺癌发病率在上升,但却不知道造成这一变化的罪魁祸首到底是谁:是工厂排放的黑烟,还是越来越多的汽车尾气?是某种我们认为不会造成污染的物质,还是香烟?答案不得而知。
1701026559
1701026560 到20世纪50年代初,英国与美国开展的一些大型研究表明,吸烟与肺癌之间存在非常显著的相关关系。在非吸烟者当中,肺癌依然十分少见,但是对吸烟者而言,患肺癌的风险却非常高。多尔(Doll)与希尔(Hill)于1950年发表的一篇非常有名的论文指出,伦敦20家医院一共有649名男性肺癌患者,其中只有两人不吸烟。今天,这样的比例一定会备受人们关注,但是在20世纪中叶的伦敦,人们并不觉得这个数据能说明什么问题,因为当时吸烟是一个非常普遍的习惯,不吸烟的人远比现在的要少。在因为其他病症而住院接受治疗的649名男性病人之中,不吸烟的人远远超过两个,为27个。而且,烟瘾越大,这种相关性就越明显。在这649名肺癌患者当中,有168人每天吸烟超过25支。
1701026561
1701026562 多尔与希尔收集的数据表明肺癌与吸烟之间存在相关性。尽管两者之间不是严格的决定性关系(有的人吸了很多烟,也没有患肺癌,而有些不吸烟的人却患有肺癌),但它们也不是两个相互独立的现象。在高尔顿与皮尔逊的示意图中,这两者之间的关系处于模糊的中间区域。
1701026563
1701026564 确认相关性的存在与解释其存在的原因不是一回事。多尔与希尔的研究并没有证明肺癌是吸烟导致的,他们在论文中指出,“如果肺癌会导致病人吸烟,或者吸烟与肺癌是同一个原因导致的两个结果,吸烟与肺癌之间就会产生某种联系。”他们认为,肺癌导致病人吸烟这个说法不是很合理,因为肿瘤不会对患者生病之前的行为产生影响,使他们养成一天吸一盒烟的习惯。而同一个原因导致这两个结果的说法则难以确认。
1701026565
1701026566 我们的老朋友、现代统计学的奠基人费舍尔,正是站在这个立场上对香烟–肺癌的相关性表示了强烈的怀疑。费舍尔是继承高尔顿与皮尔逊理念的最合适人选,他于1933年继皮尔逊之后开始担任伦敦大学学院的高尔顿优生学实验室主任(该职位现在已经更名为高尔顿遗传学实验室主任)。
1701026567
1701026568 费舍尔认为,虽然肺癌导致吸烟这一说法似乎绝不可能是正确的,但要完全推翻它仍然为时过早。
1701026569
1701026570 那么,肺癌(在患者表现出明显的肺癌症状之前的几年时间里,即将发生癌变的症状肯定已经存在,而且人们也知道这种症状的存在)会不会是导致人们吸烟的原因之一呢?我认为我们不能不考虑这种可能性。还没有足够的证据证明肺癌的确是导致人们吸烟的一个原因,但是,在即将患上肺癌时,人们会有轻微的慢性炎症的症状。我们的朋友当中可能有人在研究人们吸烟的原因,大家可能会认同,在我们感到烦躁(令人略感失望的事情、意想不到的耽搁、遭到婉拒、遇到挫折等都会让我们感到烦躁)时,我们常常会吸上一支香烟,以此来应对生活的不如意。因此,在身体某个部位出现慢性炎症时(此时,我们不会感觉到明显的疼痛),吸烟者吸烟的频率增加,不吸烟的人开始吸烟,这是完全有可能的。在患肺癌之前的15年时间里,患者可能真的可以从吸烟中获得心理安慰,禁止这些可怜的人吸烟,就像从盲人手中夺走拐杖一样,会让本来就不幸的人更加不幸。
1701026571
1701026572 从这段文字不难看出杰出的统计学家严谨治学的态度,他要求我们以同样的方式去考虑所有的可能性。同时,我们还可以看出终生吸烟的人对吸烟这个习惯的钟爱之情。(有的人认为费舍尔的研究成果具有很强的影响力,可以聘请他担任“烟草制造商常务委员会”这个英国工业组织的顾问;在我看来,费舍尔不愿意断言吸烟与肺癌之间存在因果关系,这与他一贯采用的统计方法一致。)费舍尔认为,多尔与希尔的研究对象之所以吸烟,可能是因为受到了癌变前炎症的影响。不过,他的这个观点并没有得到广泛的认同,而他的“吸烟与肺癌由某一共同原因导致”的观点却吸引了更多人的关注。费舍尔是优生学的虔诚信徒(这与他的学术头衔是相符的),他认为,当今社会在进化问题上十分宽容,因此优质基因正面临着与劣质基因婚配的风险。在费舍尔看来,人们完全有理由认为肺癌与吸烟习惯的背后有一种共同的遗传因素,但是人们还没有找到这种遗传因素。这种观点似乎纯属猜想,但是别忘了,关于“肺癌由吸烟导致”的观点在当时同样无从考证,就连实验也无法证明烟草中含有致癌的化学成分。
1701026573
1701026574 我们可以通过研究双胞胎的方式,有效地检测遗传基因对吸烟习惯的影响。如果双胞胎都吸烟或者都不吸烟,我们把这种情况称为“一致”。我们可能会认为一致的情况非常普遍,因为双胞胎小时候通常生活在同一个家庭里,有相同的父母,文化环境也相同。同卵双胞胎与异卵双胞胎都具有这些特点,而且程度相同,如果同卵双胞胎的一致程度高于异卵双胞胎,就说明遗传因素确实对吸烟习惯有某种影响。费舍尔从一些没有发表的研究报告中找出了为数不多的证据,证明同卵双胞胎的一致程度的确高于异卵双胞胎。后来的一些研究也证明他的观点是正确的,吸烟习惯至少受到遗传因素的部分影响。
1701026575
1701026576 当然,这并不是说这些基因最终导致人们患癌症。如今,我们对癌症以及吸烟致癌的原理有了更加深入的了解,吸烟可能致癌的观点为大众所接受。但是,我们也无法否认费舍尔“不可草率下结论”的研究方法是值得赞许的,怀疑相关性的做法是正确的、有益的。流行病学家简·凡登布鲁克(Jan Vandenbroucke)对费舍尔论述烟草的论文给出了这样的评价:“我惊奇地发现这些论文质量上乘、令人信服,逻辑上没有任何瑕疵,对数据与论证过程的阐述非常清楚。如果不是作者的观点有问题,这些论文绝对堪称教材典范。”
1701026577
1701026578 在20世纪50年代,科学界就肺癌与吸烟之间的关系逐渐达成了一致意见。的确,人们仍然不清楚吸烟导致肿瘤发生的生物学机制,对吸烟与癌症之间存在相关性的证明,也无法摆脱对存在相关性的观察结果的依赖。但是,1959年,鉴于观察结果数量庞大,而且人们排除了大量其他可能性,美国卫生总署的勒罗伊·伯尼(Leroy Burney)发表声明说:“当前的证据表明,吸烟是导致肺癌发病率上升的主要原因。”即使到了这个时候,他的这个立场仍然引发了人们的争议。仅仅过了几周,《美国医学协会杂志》(Journal of the American Medical Association)的编辑约翰·塔尔伯特(John Talbott)就在社论中予以反驳:“几名权威人士在检验了伯尼引用的证据后,并不同意他的结论。吸烟致癌论的支持者与反对者都没有充分的证据,可以保证权威人士站在非此即彼的立场上做出的假设是正确的。在确定的证据出现之前,医生必须密切关注相关态势、追踪各种事实,并根据自己对这些事实的评估给出医嘱,履行自己的职责。”同费舍尔一样,塔尔伯特从科学的角度对伯尼及其支持者进行了谴责,认为他们的言行过于草率。
1701026579
1701026580 关于这个问题引起的争议以及科学界的不同看法,医学史专家乔恩·哈克尼斯(Jon Harkness)为我们提供了清楚的说明。哈克尼斯通过详尽的档案研究表明,伯尼的声明实际上是由美国公共卫生署的多名科学家共同草拟的,伯尼本人几乎没有直接参与;而塔尔伯特的反击也是由与美国卫生总署唱反调的一群人代笔的。从表面上看,这是政府官员与医学机构之间的斗争,实际上它只是在公开的舞台上上演的一出科学闹剧罢了。
1701026581
1701026582 我们都知道这场闹剧是如何收尾的。20世纪60年代初,伯尼的继任者卢瑟·特里(Luther Terry)组建了一个委员会,专门研究吸烟与健康问题,并于1964年1月在面向全美的新闻报道中公布了他们所取得的成果。该报告斩钉截铁般的遣词造句令伯尼的发言相形见绌。
1701026583
1701026584 鉴于从多个来源收集的证据不断增加,本委员会断定吸烟是导致某些致命疾病和总体死亡率上升的重要原因……由于吸烟对美国人民的健康状况造成了极大的威胁,因此有必要采取适当的措施。
1701026585
1701026586 到底发生了哪些变化呢?在1964年之前,人们针对吸烟与癌症之间的相关性展开了一项又一项研究,结果发现:吸烟多的人比吸烟少的人更容易患癌症;烟草导致人体组织发生癌变的可能性特别高;吸烟者患肺癌的比例更高;用烟斗的吸烟者更易患唇癌;相较于长期吸烟的人而言,戒烟者患癌症的可能性更小。综合考虑这些因素,该委员会认为吸烟与肺癌之间不仅存在相关关系,而且存在因果关系。因此,控制烟草消费有可能使美国人延年益寿。
1701026587
1701026588 错误未必总是错的
1701026589
1701026590 假设在一个平行世界中,后期的烟草研究得出的是一个不同的结果,即费舍尔看似很奇怪的理论反倒是正确的:吸烟不是导致肺癌的原因,而是肺癌导致的一种习惯。在医学研究中,这种彻底颠覆前期研究成果的现象并不是一件不可思议的事,那么,接踵而来的会是什么呢?美国卫生总署会发布一则声明:“不好意思,我们搞错了。大家可以继续吸烟了。”但是,在此之前,烟草公司可能已经损失了一大笔钱,成千上万的烟民也没有享受到吸烟带来的乐趣,造成这一切的原因就是美国卫生总署那则言之凿凿的声明并不是事实,而只是一个证据比较充分的假设。
[ 上一页 ]  [ :1.701026541e+09 ]  [ 下一页 ]