1700952449
科学的不确定性
1700952450
1700952451
哈佛大学近来完成了一个课程评估,试图确定素质教育的核心内容。教员们考虑、讨论并打算将其纳入科学类的一个课程类别是经验推理(empirical reasoning)。这项教学提案显示了大学的宗旨应该是:教导学生如何搜集和处理经验数据,权衡证据,理解概率估计,当条件成熟时,从数据中得出推理,并在问题不能在现有证据基础上被解决时,及时作出反应。
1700952452
1700952453
这项教学要求的议案及后来的补充,其主旨非常好,但是它暗含了一个关于测量如何发挥作用的基本误解。科学家在解决问题时通常会使用概率。当然在某些特定的观点和观察上,我们可以获得确证并可以通过科学来作出合理的论断。但是人们只能偶尔依据科学或者其他方法在事实的基础上绝对正确地处理问题。虽然我们可以搜集足够多的数据来确信因果关系,甚至作出令人难以置信的精确预测,但是这种事情具有相当的概率性。正如第1章所讨论的,不确定性(不管多么小)允许有趣的潜在新现象被发现。极少有事物是百分之百确定的,在任何还没有做过测试的条件下,没有哪些理论与假设完全适用 。
1700952454
1700952455
现象只能在它们可以被测试的有效范围内,以一定的精确度呈现出来。测量往往都存在概率。许多科学测量基于一个假设:存在着我们可以通过足够清晰和准确的测量来揭示的潜在本质。我们尽量做到精确的(或者说好到足以达到我们的目标)测量以发现这些隐藏的事实。这因此存在一种情况,例如,一系列测量结果的中心区域有95%的概率包含了测量的真实值。在这种情形下,我们可以说我们有95%的把握。这样的概率告诉我们任何特定测量的可信度以及整个概率与含义的范围。如果你既不知道它伴随的不确定性也对其没有确定估计,你就不可能完全理解一个测量。
1700952456
1700952457
不确定性的一个来源是缺乏无限精确的实验装置。一个精确的测量可能要求测量仪器必须校准到小数点后的无穷多位,测量值因此就会精确到小数点后的无穷多位。实验物理学家不可能有这样的测量,他们只能校准他们的仪器到技术允许的可能精度——就像天文学家第谷·布拉赫在四个世纪以前所做的那么专业。技术的不断发展促使测量仪器精度不断提高。即便如此,测量也永远达不到无限精确。一些系统的不确定性(systematic uncertainty )[48] ,即测量仪器本身的特质,总是会存在。
1700952458
1700952459
不确定性不表示科学家对所有选项或者表述都一视同仁(尽管新闻播报时常犯此错误)。这些二选一的选项仅在很少的情况下各居50%概率。但它们意味着科学家(或者任何追求完全准确的人)会作出声明,告诉人们哪些已经被测量了,哪些是以概率的形式体现的,哪怕这概率非常高。
1700952460
1700952461
当科学家与文人墨客都极为小心谨慎时,他们将“精确”(precision)与“准确”(accuracy)区别对待。一个装置是“精确的”意味着:当你重复测量单一数量时,你所记录的数值之间相差无几。“精确度”是描述变化程度的指标。如果重复测量的结果变化不大,那么测量就是精确的。越精确的数值所跨越的范围越窄,如果你重复测量,那么平均值也越快地收敛。
1700952462
1700952463
精确度
1700952464
1700952465
当你重复测量单一数量时,你所记录的数值之间相差无几。“精确度”是描述变化程度的指标。
1700952466
1700952467
“准确度”告诉你的是:测量的平均值与准确结果接近的程度。换言之,它描述了测量装置是否有偏差。从技术上来讲,虽然测量装置的内禀误差不会降低它的精确度(因为你每次会犯同样的错误),但是它会毫无疑问地降低你的准确度。系统的不确定性反映了源于测量仪器本身的无法避免的准确度缺失。
1700952468
1700952469
准确度
1700952470
1700952471
“准确度”告诉我们的是测量的平均值与准确结果接近的程度。换言之,它描述了测量装置是否有偏差。
1700952472
1700952473
然而在许多情形下,即便你可以构造出完美测量的仪器,你仍需采取多次测量来得到正确的结果。这是因为另一个不确定性的来源[49] 是“统计性的”,也就是说测量通常需要重复很多次才能给出你所信赖的结果。所以,即便是一个准确的设备也不一定在任一特定的测量中给出一个正确的结果,但是多次测量的平均值会收敛落到正确的结果上。系统的不确定性掌控了测量的准确度,而统计的不确定性影响其精确度 。一个好的科学研究在这两个方面上都要考量,因此测量要在可行的范围内、尽量多的样品上尽可能仔细地展开。理论上说,你想让你的测量既准确又精确,以至于所期的绝对误差很小,因此你可以信赖你所发现的结果。也就是说,你想让数值落到一个尽可能窄的范围内(精确),并让它们收敛到正确的数值上面(准确)。
1700952474
1700952475
我们可以考虑一个熟悉且重要的例子:药物疗效实验。医生通常不会讲他们可能也不了解相关的统计。当你被告知“这种药有时有效、有时没效”时,你有没有感到沮丧?不少有用资讯被这种表述所抑制,使人对这种药物的有效性充满疑惑。于是,怎么做成为一件难以抉择的事情。一个相对较为有用的表述应该告诉我们:药物或者疗程以怎样的一个比例,在年龄和胖瘦程度相似的病人身上起了什么作用。这样,即便医生们自己不懂统计学,他们也可以肯定地给出一些有用的数据和信息。
1700952476
1700952477
平心而论,人的差异性加之个体对药物的不同反应,使得断定一种药品是否有效成为一个复杂的问题。所以让我们先考虑一个简单一些的情形,来检测一个单独的个体。
1700952478
1700952479
我们用测试阿司匹林是否有助于减轻头疼的过程来作为例子。解决的方法看似相当简单:吃一颗阿司匹林看是否有效。但是实际情况要稍微复杂一点。因为即便你感觉好些,你又怎能知道一定是阿司匹林起的功效呢?为了能确切知道是不是阿司匹林的效用(即,是否你服药了头疼就会减轻,或者疼痛好得比没有服药时快),你需要有吃药与不吃药的比较。然而,你要么吃药要么不吃,单单一次测试是不足以告诉你答案的。
1700952480
1700952481
奏效的方法是做很多次测试。每次一旦头疼,抛硬币来决定是否需要吃一颗阿司匹林并且记录结果。当你做了足够多测试,把各种不同类型的头疼,以及变化的环境(例如,当你没那么困倦时头疼好得更快一些)取平均,并用统计来得出正确的结论。假定你的测试没有偏差,因为你是用抛硬币来决定是否吃药,并且你所采用的人口样本就只有你自己,那么你的结果会在自己所采用的足够多的测试上正确收敛。
1700952482
1700952483
要是总能了解药物在这样简单的程序下有效与否那该有多好。但是绝大多数药物治疗的都是比头疼严重得多的疾病,而且许多药物还有长期效应,因此哪怕你想,你也不能在一个病患身上反复地进行短期试验。
1700952484
1700952485
通常当生物学家或者医生测试一种药品的功效有多少时,他们不是研究单一的病患,即便从科学的角度上看他们更愿意那样做。因此他们必须接受一个事实,那就是人们对同种药物的反应不同。任何药物都产生不同结果,哪怕是在病情严重程度一样的群体上进行测试。于是在多数情况下,科学家所能做到的最好的事情是:在他们决定要给单一病患用药前,研究尽可能与其相似的群体。然而在现实中,多数医生并不自己开展研究,因此他们很难保证病人病情严重程度的相似性。
1700952486
1700952487
医生可能打算转而试图使用已经存在的研究——那些还没有人做过仔细设计的实验,而结果简单地来源于对已经存在的群体的观察,比如说对美国健康维护组织(HMO)成员的观察。他们就会面临如何作出正确诠释的挑战。在这些研究中,要确定相关测试导致的是因果关系而非其中的关联性,这是很困难的。比如有人可能会错误地论断说:黄色手指会导致肺癌,因为他们发现很多肺癌患者的手指都是黄色的。
1700952488
1700952489
这就是为什么科学家比较喜欢研究中的治疗结果或对象都是随机选取的。例如,一项吃药与否由抛硬币决定的研究会更少地依赖于人口样本,因为病患是否服药取决于抛出硬币的随机结果。相似地,随机研究原则上也能揭示吸烟与肺癌和黄色手指的关系。如果你将一个群体的成员随机地分配到吸烟组或者禁烟组,你会确定吸烟对于你所观察的病患至少是一个对黄色手指与肺癌两种现象都负有责任的潜在因素,但不能确定其是否造成了这种结果。当然这种特殊的研究是不合伦理的。
1700952490
1700952491
在任何可能的时候,科学家总是尽可能地简化系统,来分离出他们想研究的特定现象。选择明确的人口样本与合理的控制组,对于结果的精确度与准确度都至关重要 。一些类似人体生物学中药效如何作用的复杂问题总是伴随着诸多同时发挥作用的因素。于是一个相关的问题是:这些结果需要有多少可信度?
1700952492
1700952493
测量的客观性
1700952494
1700952495
测量永远不可能完美。在科学研究(以及任何决策)中,我们需要决定不确定性的可接受程度 。这使我们可以不断向前。举例来说,如果你想通过吃药来减轻头疼的症状,如果那种药可以有效帮助哪怕只有75%的一般患者(只要副作用很小),那么你可能也愿意试试。反过来,如果调整饮食可以使你从本来已经很低的心脏疾病的可能性中减低0.1个百分点的风险,比如从5%减少到4.9%,那么恐怕这也不足以令你担心到让你放弃自己最爱的波士顿奶油派的地步。
1700952496
1700952497
关于公众政策,决策点可能更不清晰。公众观点通常具有一个灰色区域——在改变律法或者实施法规时,人们不必赞同我们对于某些事情的了解程度有多准确。许多因素使必要的计算变得更加复杂。就像在前文讨论的在目标与方法中存在的歧义性使得成本-收益的分析变得非常难于可靠地(即便不是完全不可能)进行。
1700952498
[
上一页 ]
[ :1.700952449e+09 ]
[
下一页 ]