1700952456
1700952457
不确定性的一个来源是缺乏无限精确的实验装置。一个精确的测量可能要求测量仪器必须校准到小数点后的无穷多位,测量值因此就会精确到小数点后的无穷多位。实验物理学家不可能有这样的测量,他们只能校准他们的仪器到技术允许的可能精度——就像天文学家第谷·布拉赫在四个世纪以前所做的那么专业。技术的不断发展促使测量仪器精度不断提高。即便如此,测量也永远达不到无限精确。一些系统的不确定性(systematic uncertainty )[48] ,即测量仪器本身的特质,总是会存在。
1700952458
1700952459
不确定性不表示科学家对所有选项或者表述都一视同仁(尽管新闻播报时常犯此错误)。这些二选一的选项仅在很少的情况下各居50%概率。但它们意味着科学家(或者任何追求完全准确的人)会作出声明,告诉人们哪些已经被测量了,哪些是以概率的形式体现的,哪怕这概率非常高。
1700952460
1700952461
当科学家与文人墨客都极为小心谨慎时,他们将“精确”(precision)与“准确”(accuracy)区别对待。一个装置是“精确的”意味着:当你重复测量单一数量时,你所记录的数值之间相差无几。“精确度”是描述变化程度的指标。如果重复测量的结果变化不大,那么测量就是精确的。越精确的数值所跨越的范围越窄,如果你重复测量,那么平均值也越快地收敛。
1700952462
1700952463
精确度
1700952464
1700952465
当你重复测量单一数量时,你所记录的数值之间相差无几。“精确度”是描述变化程度的指标。
1700952466
1700952467
“准确度”告诉你的是:测量的平均值与准确结果接近的程度。换言之,它描述了测量装置是否有偏差。从技术上来讲,虽然测量装置的内禀误差不会降低它的精确度(因为你每次会犯同样的错误),但是它会毫无疑问地降低你的准确度。系统的不确定性反映了源于测量仪器本身的无法避免的准确度缺失。
1700952468
1700952469
准确度
1700952470
1700952471
“准确度”告诉我们的是测量的平均值与准确结果接近的程度。换言之,它描述了测量装置是否有偏差。
1700952472
1700952473
然而在许多情形下,即便你可以构造出完美测量的仪器,你仍需采取多次测量来得到正确的结果。这是因为另一个不确定性的来源[49] 是“统计性的”,也就是说测量通常需要重复很多次才能给出你所信赖的结果。所以,即便是一个准确的设备也不一定在任一特定的测量中给出一个正确的结果,但是多次测量的平均值会收敛落到正确的结果上。系统的不确定性掌控了测量的准确度,而统计的不确定性影响其精确度 。一个好的科学研究在这两个方面上都要考量,因此测量要在可行的范围内、尽量多的样品上尽可能仔细地展开。理论上说,你想让你的测量既准确又精确,以至于所期的绝对误差很小,因此你可以信赖你所发现的结果。也就是说,你想让数值落到一个尽可能窄的范围内(精确),并让它们收敛到正确的数值上面(准确)。
1700952474
1700952475
我们可以考虑一个熟悉且重要的例子:药物疗效实验。医生通常不会讲他们可能也不了解相关的统计。当你被告知“这种药有时有效、有时没效”时,你有没有感到沮丧?不少有用资讯被这种表述所抑制,使人对这种药物的有效性充满疑惑。于是,怎么做成为一件难以抉择的事情。一个相对较为有用的表述应该告诉我们:药物或者疗程以怎样的一个比例,在年龄和胖瘦程度相似的病人身上起了什么作用。这样,即便医生们自己不懂统计学,他们也可以肯定地给出一些有用的数据和信息。
1700952476
1700952477
平心而论,人的差异性加之个体对药物的不同反应,使得断定一种药品是否有效成为一个复杂的问题。所以让我们先考虑一个简单一些的情形,来检测一个单独的个体。
1700952478
1700952479
我们用测试阿司匹林是否有助于减轻头疼的过程来作为例子。解决的方法看似相当简单:吃一颗阿司匹林看是否有效。但是实际情况要稍微复杂一点。因为即便你感觉好些,你又怎能知道一定是阿司匹林起的功效呢?为了能确切知道是不是阿司匹林的效用(即,是否你服药了头疼就会减轻,或者疼痛好得比没有服药时快),你需要有吃药与不吃药的比较。然而,你要么吃药要么不吃,单单一次测试是不足以告诉你答案的。
1700952480
1700952481
奏效的方法是做很多次测试。每次一旦头疼,抛硬币来决定是否需要吃一颗阿司匹林并且记录结果。当你做了足够多测试,把各种不同类型的头疼,以及变化的环境(例如,当你没那么困倦时头疼好得更快一些)取平均,并用统计来得出正确的结论。假定你的测试没有偏差,因为你是用抛硬币来决定是否吃药,并且你所采用的人口样本就只有你自己,那么你的结果会在自己所采用的足够多的测试上正确收敛。
1700952482
1700952483
要是总能了解药物在这样简单的程序下有效与否那该有多好。但是绝大多数药物治疗的都是比头疼严重得多的疾病,而且许多药物还有长期效应,因此哪怕你想,你也不能在一个病患身上反复地进行短期试验。
1700952484
1700952485
通常当生物学家或者医生测试一种药品的功效有多少时,他们不是研究单一的病患,即便从科学的角度上看他们更愿意那样做。因此他们必须接受一个事实,那就是人们对同种药物的反应不同。任何药物都产生不同结果,哪怕是在病情严重程度一样的群体上进行测试。于是在多数情况下,科学家所能做到的最好的事情是:在他们决定要给单一病患用药前,研究尽可能与其相似的群体。然而在现实中,多数医生并不自己开展研究,因此他们很难保证病人病情严重程度的相似性。
1700952486
1700952487
医生可能打算转而试图使用已经存在的研究——那些还没有人做过仔细设计的实验,而结果简单地来源于对已经存在的群体的观察,比如说对美国健康维护组织(HMO)成员的观察。他们就会面临如何作出正确诠释的挑战。在这些研究中,要确定相关测试导致的是因果关系而非其中的关联性,这是很困难的。比如有人可能会错误地论断说:黄色手指会导致肺癌,因为他们发现很多肺癌患者的手指都是黄色的。
1700952488
1700952489
这就是为什么科学家比较喜欢研究中的治疗结果或对象都是随机选取的。例如,一项吃药与否由抛硬币决定的研究会更少地依赖于人口样本,因为病患是否服药取决于抛出硬币的随机结果。相似地,随机研究原则上也能揭示吸烟与肺癌和黄色手指的关系。如果你将一个群体的成员随机地分配到吸烟组或者禁烟组,你会确定吸烟对于你所观察的病患至少是一个对黄色手指与肺癌两种现象都负有责任的潜在因素,但不能确定其是否造成了这种结果。当然这种特殊的研究是不合伦理的。
1700952490
1700952491
在任何可能的时候,科学家总是尽可能地简化系统,来分离出他们想研究的特定现象。选择明确的人口样本与合理的控制组,对于结果的精确度与准确度都至关重要 。一些类似人体生物学中药效如何作用的复杂问题总是伴随着诸多同时发挥作用的因素。于是一个相关的问题是:这些结果需要有多少可信度?
1700952492
1700952493
测量的客观性
1700952494
1700952495
测量永远不可能完美。在科学研究(以及任何决策)中,我们需要决定不确定性的可接受程度 。这使我们可以不断向前。举例来说,如果你想通过吃药来减轻头疼的症状,如果那种药可以有效帮助哪怕只有75%的一般患者(只要副作用很小),那么你可能也愿意试试。反过来,如果调整饮食可以使你从本来已经很低的心脏疾病的可能性中减低0.1个百分点的风险,比如从5%减少到4.9%,那么恐怕这也不足以令你担心到让你放弃自己最爱的波士顿奶油派的地步。
1700952496
1700952497
关于公众政策,决策点可能更不清晰。公众观点通常具有一个灰色区域——在改变律法或者实施法规时,人们不必赞同我们对于某些事情的了解程度有多准确。许多因素使必要的计算变得更加复杂。就像在前文讨论的在目标与方法中存在的歧义性使得成本-收益的分析变得非常难于可靠地(即便不是完全不可能)进行。
1700952498
1700952499
《纽约时报》的专栏作家纪思道(Nicholas Kristof)在关于谨慎对待食品与容器中含有的潜在有害化学物质BPA[50] 的辩论中写道:“BPA的研究已经敲响警钟几十年了,证据依然复杂而且处于争论中。这就是生活:在真实世界,监管决策时常必须由有争议与有冲突的数据组成。”[1]
1700952500
1700952501
所有这些并非表明我们不应该在评估政策时立足于成本与收益的定量估计。然而这表示了我们应该清楚地知道评估的意思,以及根据假设或目标,成本、收益可以改变的程度,计算中哪些被考虑了、哪些没有。成本-收益分析可以是有用的,但也可以显现出具体性、必然性与安全性的错觉,从而可能导致其在社会上被误用。
1700952502
1700952503
对物理学家来说幸运的是:通常我们所问的问题比公众政策的问题(至少在制定政策方面)简单得多。当我们处理纯粹的知识而非其应用时,我们会进行不同的调查。测量基本粒子至少在原则上简单得多。所有电子的本质相同。你必须考虑统计与系统误差,但不用考虑种群的差异性,一个电子的行为可以代表它们所有电子的行为。但是对相同的统计与系统误差,科学家试图在可行的范围内将这些减到最小,然而他们能达到的程度取决于他们想回答的问题。
1700952504
1700952505
尽管如此,即便在“简单的”物理系统中,测量也从来不是完美的,因此我们需要确定准确度目标。在应用水平上,相同的问题是,实验物理学家要重复多少次测量、测量仪器需要准确到什么程度。答案取决于物理学家自己,可以接受的不确定性范围有赖于他所问的问题。不同的目标需要不同的准确度与精确度。
[
上一页 ]
[ :1.700952456e+09 ]
[
下一页 ]