打字猴:1.701026573e+09

1701026573

1701026574 我们可以通过研究双胞胎的方式，有效地检测遗传基因对吸烟习惯的影响。如果双胞胎都吸烟或者都不吸烟，我们把这种情况称为“一致”。我们可能会认为一致的情况非常普遍，因为双胞胎小时候通常生活在同一个家庭里，有相同的父母，文化环境也相同。同卵双胞胎与异卵双胞胎都具有这些特点，而且程度相同，如果同卵双胞胎的一致程度高于异卵双胞胎，就说明遗传因素确实对吸烟习惯有某种影响。费舍尔从一些没有发表的研究报告中找出了为数不多的证据，证明同卵双胞胎的一致程度的确高于异卵双胞胎。后来的一些研究也证明他的观点是正确的，吸烟习惯至少受到遗传因素的部分影响。

1701026575

1701026576 当然，这并不是说这些基因最终导致人们患癌症。如今，我们对癌症以及吸烟致癌的原理有了更加深入的了解，吸烟可能致癌的观点为大众所接受。但是，我们也无法否认费舍尔“不可草率下结论”的研究方法是值得赞许的，怀疑相关性的做法是正确的、有益的。流行病学家简·凡登布鲁克（Jan Vandenbroucke）对费舍尔论述烟草的论文给出了这样的评价：“我惊奇地发现这些论文质量上乘、令人信服，逻辑上没有任何瑕疵，对数据与论证过程的阐述非常清楚。如果不是作者的观点有问题，这些论文绝对堪称教材典范。”

1701026577

1701026578 在20世纪50年代，科学界就肺癌与吸烟之间的关系逐渐达成了一致意见。的确，人们仍然不清楚吸烟导致肿瘤发生的生物学机制，对吸烟与癌症之间存在相关性的证明，也无法摆脱对存在相关性的观察结果的依赖。但是，1959年，鉴于观察结果数量庞大，而且人们排除了大量其他可能性，美国卫生总署的勒罗伊·伯尼（Leroy Burney）发表声明说：“当前的证据表明，吸烟是导致肺癌发病率上升的主要原因。”即使到了这个时候，他的这个立场仍然引发了人们的争议。仅仅过了几周，《美国医学协会杂志》（Journal of the American Medical Association）的编辑约翰·塔尔伯特（John Talbott）就在社论中予以反驳：“几名权威人士在检验了伯尼引用的证据后，并不同意他的结论。吸烟致癌论的支持者与反对者都没有充分的证据，可以保证权威人士站在非此即彼的立场上做出的假设是正确的。在确定的证据出现之前，医生必须密切关注相关态势、追踪各种事实，并根据自己对这些事实的评估给出医嘱，履行自己的职责。”同费舍尔一样，塔尔伯特从科学的角度对伯尼及其支持者进行了谴责，认为他们的言行过于草率。

1701026579

1701026580 关于这个问题引起的争议以及科学界的不同看法，医学史专家乔恩·哈克尼斯（Jon Harkness）为我们提供了清楚的说明。哈克尼斯通过详尽的档案研究表明，伯尼的声明实际上是由美国公共卫生署的多名科学家共同草拟的，伯尼本人几乎没有直接参与；而塔尔伯特的反击也是由与美国卫生总署唱反调的一群人代笔的。从表面上看，这是政府官员与医学机构之间的斗争，实际上它只是在公开的舞台上上演的一出科学闹剧罢了。

1701026581

1701026582 我们都知道这场闹剧是如何收尾的。20世纪60年代初，伯尼的继任者卢瑟·特里（Luther Terry）组建了一个委员会，专门研究吸烟与健康问题，并于1964年1月在面向全美的新闻报道中公布了他们所取得的成果。该报告斩钉截铁般的遣词造句令伯尼的发言相形见绌。

1701026583

1701026584 鉴于从多个来源收集的证据不断增加，本委员会断定吸烟是导致某些致命疾病和总体死亡率上升的重要原因……由于吸烟对美国人民的健康状况造成了极大的威胁，因此有必要采取适当的措施。

1701026585

1701026586 到底发生了哪些变化呢？在1964年之前，人们针对吸烟与癌症之间的相关性展开了一项又一项研究，结果发现：吸烟多的人比吸烟少的人更容易患癌症；烟草导致人体组织发生癌变的可能性特别高；吸烟者患肺癌的比例更高；用烟斗的吸烟者更易患唇癌；相较于长期吸烟的人而言，戒烟者患癌症的可能性更小。综合考虑这些因素，该委员会认为吸烟与肺癌之间不仅存在相关关系，而且存在因果关系。因此，控制烟草消费有可能使美国人延年益寿。

1701026587

1701026588 错误未必总是错的

1701026589

1701026590 假设在一个平行世界中，后期的烟草研究得出的是一个不同的结果，即费舍尔看似很奇怪的理论反倒是正确的：吸烟不是导致肺癌的原因，而是肺癌导致的一种习惯。在医学研究中，这种彻底颠覆前期研究成果的现象并不是一件不可思议的事，那么，接踵而来的会是什么呢？美国卫生总署会发布一则声明：“不好意思，我们搞错了。大家可以继续吸烟了。”但是，在此之前，烟草公司可能已经损失了一大笔钱，成千上万的烟民也没有享受到吸烟带来的乐趣，造成这一切的原因就是美国卫生总署那则言之凿凿的声明并不是事实，而只是一个证据比较充分的假设。

1701026591

1701026592 但是，美国卫生总署有其他选择吗？大家可以想一想必须采取哪些步骤才能确定吸烟真的会致癌。我们必须征募大批青少年，从中随机选择一半人，让他们在之后50年里定时定量地吸烟，而另外一半人则不能吸烟。吸烟危害性研究的先驱杰里·考恩菲尔德（Jerry Cornfi eld）认为，这样的实验可望而不可即。虽然这样的实验在逻辑上是可能的，但是它会严重践踏以人为实验对象时应该遵循的所有道德标准。

1701026593

1701026594 科学研究中允许存在不确定性，但是公共政策的制定者们却没有这种权力。他们必须做出最准确的预测，然后在这些预测的基础上做出决策。当这种机制运行顺畅（毫无疑问，它在吸烟问题上没出问题）时，科学家与政策制定者就会相互协作：科学家计算出我们所面临的情况的不确定程度，政策制定者则决定在这种不确定的程度下应该采取何种措施。

1701026595

1701026596 有时，这样的机制也会导致错误的发生。前面我们讨论过荷尔蒙替代疗法，在很长一段时间里，人们认为这种治疗方法可以帮助绝经后的妇女预防心脏病。但是，今天的医学界往往会根据一些最新的实验结果给出相反的建议。

1701026597

1701026598 1976年和2009年，美国政府先后两次投入巨资，开展为美国人民接种猪流感疫苗的大规模活动，结果，这两次活动都受到了流行病学家的警告。流行病学家们认为，虽然这两次流感都比较严重，但远没有达到会引发灾难的程度，相反，政府的过度紧张却很有可能在全美范围内引起恐慌。

1701026599

1701026600 在这种情形下，人们往往会指责政府官员制定了超前于科学的政策。但是，实际情况没有那么简单，因为错误未必总是错的。

1701026601

1701026602 为什么这么说呢？只要运用前文介绍的期望值知识，就会知道这句话其实并非自相矛盾。假设我们正在考虑是否应该建议人们不要吃茄子。一系列的研究发现，经常吃茄子的人与不吃茄子的人相比，发生突发性心力衰竭的可能性要大一点儿。因此，人们认为茄子有导致突发性心力衰竭的可能性，不过这种可能性比较小。但是，我们无法强迫某些人吃茄子或者不吃茄子，我们也不可能随机选择一大批人做对照实验。我们手头掌握的信息仅表现出某种相关性，而我们可以利用的只有这些信息。据我们所知，嗜好吃茄子与心脏停跳背后没有共同的遗传因素，但是，我们没有办法证明。

1701026603

1701026604 也许，我们有75%的把握认为我们的结论是正确的，禁吃茄子的运动每年可能会挽救上千个美国人的生命。但是，我们的结论也有25%的概率是错的。如果我们真的弄错了，导致很多喜欢吃茄子的人因此放弃了吃茄子，他们的饮食结构就不像以前那样健康，而且每年的死亡人数有所增加，比如，为200人。[1]

1701026605

1701026606 跟以前一样，我们可以把各种可能的结果与其对应的概率相乘再加总，算出期望值。在本例中，期望值为：

1701026607

1701026608 75%×1 000 + 25%×（–200）=750–50=700

1701026609

1701026610 因此，我们这条建议每年可挽救人数的期望值是700个。尽管“茄子理事会”投入大量资金，明确地提出抗议，而我们也确实没有十足的把握，但是我们仍然给出了这条建议。

1701026611

1701026612 请记住，期望值并不代表我们期望发生的结果，而是指在多次做出该决定后的平均结果。公共卫生方面的决策与抛硬币不同，因为我们只有一次选择的机会。另外，我们需要评估的环境威胁也不仅仅是茄子这一项。接下来，我们也许会注意到菜花与关节炎之间存在相关性，或者电动牙刷有可能引发孤独症。在这两种情况下，如果某项措施每年挽救人数的期望值可以达到700个，我们就应该有所行动，以期平均每年可以挽救700人的生命。在单独的个案中，我们所采取的措施可能弊大于利，但是整体来看，我们可以挽救很多条生命。彩票玩家在奖金向下分配日很有可能大赚一笔，同样，虽然我们在每个具体例子中有决策失当的风险，但是从长远看，在我们的所有决策中，正确的将占大多数。

1701026613

1701026614 如果我们对证据提出更加严格的要求，在不能确定其准确性时拒绝给出这些建议，会怎么样呢？那些本来可以被挽救的生命就会因为这个决定而遭遇不幸。

1701026615

1701026616 准确、客观地确定现实生活中各种健康难题的发生概率，的确具有非比寻常的意义，但问题是我们做不到。这也正是服用药物跟抛硬币、买彩票不同的另一个原因。反映我们对各种假设的信任程度的概率非常含糊，费舍尔甚至坚定地认为它们根本不能被称为概率。因此，在这些概率交织到一起之后，我们往往无所适从，在决定是否发起禁止吃茄子、反对使用电动牙刷或者禁烟运动时，我们不知道也无法知道其期望值到底是多少。但是，我们常常能确定该期望值为正值。当然，期望值为正值并不代表发起这项运动就一定会取得积极的效果，而是说明在一段时间里多次发起类似的运动，其总的效果很可能利大于弊。不确定性的本质是，我们不知道自己做出的那些选择（例如禁烟）是否有益，也不知道那些选择（例如建议采用荷尔蒙替代疗法）是否会造成伤害。但是，如果因为某些建议有可能是不正确的就避之不及，这种做法与乔治·施蒂格勒所批评的“候机时间过长”问题非常相似，毫无疑问是失败的选择。如果我们一定要等到有十足把握时才提出建议，就说明我们在及时提供意见这方面做得很不够。

1701026617

1701026618 相貌英俊的男性为什么不友善呢？

1701026619

1701026620 相关性有可能是某些尚未被人们发现的共同原因造成的，因此令人困惑，但是更加难以捉摸的是，相关性还有可能是某些共同结果造成的。这个现象叫作“柏克森悖论”（Berkson’s Fallacy），是以我们在第8章介绍的约瑟夫·柏克森这位医学统计学家的名字命名的。柏克森告诫人们不可盲目依赖p值，否则便可能得出“其中有一名白化病人的一小群人都不是人”的荒谬结论。

1701026621

1701026622 与费舍尔一样，柏克森本人也强烈怀疑吸烟与肺癌之间存在联系的观点。柏克森这位医学博士代表的是老一辈的流行病学家，他们坚定地认为过于依赖统计数据而忽略医学研究的任何说法都是不可靠的。在他看来，这些说法是稚嫩的理论学家擅自闯入医学领域后草率得出的结论。1958年，他在著作中指出：“癌症是生物学问题，而不是统计学问题。在阐释癌症问题时，统计学可以发挥非常好的辅助作用，但是，如果生物学家听任统计学家在生物学问题上指手画脚，就必然会给科学带来灾难。”

[ 上一页 ] [ :1.701026573e+09 ] [ 下一页 ]