打字猴:1.70095247e+09
1700952470
1700952471 “准确度”告诉我们的是测量的平均值与准确结果接近的程度。换言之,它描述了测量装置是否有偏差。
1700952472
1700952473 然而在许多情形下,即便你可以构造出完美测量的仪器,你仍需采取多次测量来得到正确的结果。这是因为另一个不确定性的来源[49] 是“统计性的”,也就是说测量通常需要重复很多次才能给出你所信赖的结果。所以,即便是一个准确的设备也不一定在任一特定的测量中给出一个正确的结果,但是多次测量的平均值会收敛落到正确的结果上。系统的不确定性掌控了测量的准确度,而统计的不确定性影响其精确度 。一个好的科学研究在这两个方面上都要考量,因此测量要在可行的范围内、尽量多的样品上尽可能仔细地展开。理论上说,你想让你的测量既准确又精确,以至于所期的绝对误差很小,因此你可以信赖你所发现的结果。也就是说,你想让数值落到一个尽可能窄的范围内(精确),并让它们收敛到正确的数值上面(准确)。
1700952474
1700952475 我们可以考虑一个熟悉且重要的例子:药物疗效实验。医生通常不会讲他们可能也不了解相关的统计。当你被告知“这种药有时有效、有时没效”时,你有没有感到沮丧?不少有用资讯被这种表述所抑制,使人对这种药物的有效性充满疑惑。于是,怎么做成为一件难以抉择的事情。一个相对较为有用的表述应该告诉我们:药物或者疗程以怎样的一个比例,在年龄和胖瘦程度相似的病人身上起了什么作用。这样,即便医生们自己不懂统计学,他们也可以肯定地给出一些有用的数据和信息。
1700952476
1700952477 平心而论,人的差异性加之个体对药物的不同反应,使得断定一种药品是否有效成为一个复杂的问题。所以让我们先考虑一个简单一些的情形,来检测一个单独的个体。
1700952478
1700952479 我们用测试阿司匹林是否有助于减轻头疼的过程来作为例子。解决的方法看似相当简单:吃一颗阿司匹林看是否有效。但是实际情况要稍微复杂一点。因为即便你感觉好些,你又怎能知道一定是阿司匹林起的功效呢?为了能确切知道是不是阿司匹林的效用(即,是否你服药了头疼就会减轻,或者疼痛好得比没有服药时快),你需要有吃药与不吃药的比较。然而,你要么吃药要么不吃,单单一次测试是不足以告诉你答案的。
1700952480
1700952481 奏效的方法是做很多次测试。每次一旦头疼,抛硬币来决定是否需要吃一颗阿司匹林并且记录结果。当你做了足够多测试,把各种不同类型的头疼,以及变化的环境(例如,当你没那么困倦时头疼好得更快一些)取平均,并用统计来得出正确的结论。假定你的测试没有偏差,因为你是用抛硬币来决定是否吃药,并且你所采用的人口样本就只有你自己,那么你的结果会在自己所采用的足够多的测试上正确收敛。
1700952482
1700952483 要是总能了解药物在这样简单的程序下有效与否那该有多好。但是绝大多数药物治疗的都是比头疼严重得多的疾病,而且许多药物还有长期效应,因此哪怕你想,你也不能在一个病患身上反复地进行短期试验。
1700952484
1700952485 通常当生物学家或者医生测试一种药品的功效有多少时,他们不是研究单一的病患,即便从科学的角度上看他们更愿意那样做。因此他们必须接受一个事实,那就是人们对同种药物的反应不同。任何药物都产生不同结果,哪怕是在病情严重程度一样的群体上进行测试。于是在多数情况下,科学家所能做到的最好的事情是:在他们决定要给单一病患用药前,研究尽可能与其相似的群体。然而在现实中,多数医生并不自己开展研究,因此他们很难保证病人病情严重程度的相似性。
1700952486
1700952487 医生可能打算转而试图使用已经存在的研究——那些还没有人做过仔细设计的实验,而结果简单地来源于对已经存在的群体的观察,比如说对美国健康维护组织(HMO)成员的观察。他们就会面临如何作出正确诠释的挑战。在这些研究中,要确定相关测试导致的是因果关系而非其中的关联性,这是很困难的。比如有人可能会错误地论断说:黄色手指会导致肺癌,因为他们发现很多肺癌患者的手指都是黄色的。
1700952488
1700952489 这就是为什么科学家比较喜欢研究中的治疗结果或对象都是随机选取的。例如,一项吃药与否由抛硬币决定的研究会更少地依赖于人口样本,因为病患是否服药取决于抛出硬币的随机结果。相似地,随机研究原则上也能揭示吸烟与肺癌和黄色手指的关系。如果你将一个群体的成员随机地分配到吸烟组或者禁烟组,你会确定吸烟对于你所观察的病患至少是一个对黄色手指与肺癌两种现象都负有责任的潜在因素,但不能确定其是否造成了这种结果。当然这种特殊的研究是不合伦理的。
1700952490
1700952491 在任何可能的时候,科学家总是尽可能地简化系统,来分离出他们想研究的特定现象。选择明确的人口样本与合理的控制组,对于结果的精确度与准确度都至关重要 。一些类似人体生物学中药效如何作用的复杂问题总是伴随着诸多同时发挥作用的因素。于是一个相关的问题是:这些结果需要有多少可信度?
1700952492
1700952493 测量的客观性
1700952494
1700952495 测量永远不可能完美。在科学研究(以及任何决策)中,我们需要决定不确定性的可接受程度 。这使我们可以不断向前。举例来说,如果你想通过吃药来减轻头疼的症状,如果那种药可以有效帮助哪怕只有75%的一般患者(只要副作用很小),那么你可能也愿意试试。反过来,如果调整饮食可以使你从本来已经很低的心脏疾病的可能性中减低0.1个百分点的风险,比如从5%减少到4.9%,那么恐怕这也不足以令你担心到让你放弃自己最爱的波士顿奶油派的地步。
1700952496
1700952497 关于公众政策,决策点可能更不清晰。公众观点通常具有一个灰色区域——在改变律法或者实施法规时,人们不必赞同我们对于某些事情的了解程度有多准确。许多因素使必要的计算变得更加复杂。就像在前文讨论的在目标与方法中存在的歧义性使得成本-收益的分析变得非常难于可靠地(即便不是完全不可能)进行。
1700952498
1700952499 《纽约时报》的专栏作家纪思道(Nicholas Kristof)在关于谨慎对待食品与容器中含有的潜在有害化学物质BPA[50] 的辩论中写道:“BPA的研究已经敲响警钟几十年了,证据依然复杂而且处于争论中。这就是生活:在真实世界,监管决策时常必须由有争议与有冲突的数据组成。”[1]
1700952500
1700952501 所有这些并非表明我们不应该在评估政策时立足于成本与收益的定量估计。然而这表示了我们应该清楚地知道评估的意思,以及根据假设或目标,成本、收益可以改变的程度,计算中哪些被考虑了、哪些没有。成本-收益分析可以是有用的,但也可以显现出具体性、必然性与安全性的错觉,从而可能导致其在社会上被误用。
1700952502
1700952503 对物理学家来说幸运的是:通常我们所问的问题比公众政策的问题(至少在制定政策方面)简单得多。当我们处理纯粹的知识而非其应用时,我们会进行不同的调查。测量基本粒子至少在原则上简单得多。所有电子的本质相同。你必须考虑统计与系统误差,但不用考虑种群的差异性,一个电子的行为可以代表它们所有电子的行为。但是对相同的统计与系统误差,科学家试图在可行的范围内将这些减到最小,然而他们能达到的程度取决于他们想回答的问题。
1700952504
1700952505 尽管如此,即便在“简单的”物理系统中,测量也从来不是完美的,因此我们需要确定准确度目标。在应用水平上,相同的问题是,实验物理学家要重复多少次测量、测量仪器需要准确到什么程度。答案取决于物理学家自己,可以接受的不确定性范围有赖于他所问的问题。不同的目标需要不同的准确度与精确度。
1700952506
1700952507 例如,原子钟测量时间的稳定性达到了十万亿分之一[51] ,但是很少有测量需要对时间达到这么高的精度。测量爱因斯坦的引力理论是一个例外,它需要使用尽可能高的精确度和准确度。即便目前的所有测试都证明这个理论正确,测量还需要不断改进。有更高的精确度,至今还未被发现的偏差所代表的新物理效应就可能显现出来,而这在以前精确度较低时是不可能的。如果有,偏差就会为我们提供对新物理现象的重要洞察力;如果没有,就可以相信爱因斯坦的理论比我们已经论证的还要更准确,就可以在更高能标、更广距离范围、更高准确度上放心地使用它。反过来,如果你要将人类送去月球,你必须充分懂得物理定律,这样才可以正确地瞄准火箭方向,但是你无须使用广义相对论——你当然也无须考虑可能存在的偏差的潜在影响。
1700952508
1700952509 走运的粒子物理学家
1700952510
1700952511 在粒子物理学中,我们会探索可以探测的统治最小与最基本物质组分的基本定律。单次实验并不测量混杂在一起的许多单次碰撞或多次复杂碰撞。我们所做的预测应用于已知粒子在给定能量上的单次碰撞。粒子进入碰撞点,相互作用,沿着探测器飞行,沿途沉积能量。物理学家刻画粒子碰撞乃是依据粒子飞出时的不同性质,即其质量、能量及电荷。
1700952512
1700952513 从这种意义上说,尽管我们的实验技术面对不少挑战,粒子物理学家却很走运。我们研究尽可能基本的系统,以便分离出基本的组分和定律。该想法是,让实验体系在现有资源的允许下尽量单纯。物理学家面对的挑战是获得所需的物理参数而非解开复杂体系。科学为了得到有趣的结果必须要推动认知的前沿,所以实验是很困难的。它们因此往往处在技术所能达到的能量与距离的极限处。
1700952514
1700952515 事实上,粒子物理学实验并不都那么简单,即使它仅仅研究基本物理量。实验物理学家在展示他们的结果时面临两种挑战。如果他们的确发现奇异的东西,那么他们还必须证明它不是寻常标准模型的事件。另一方面,如果没有发现新东西,那么他们还必须确定其准确度足以展现一个更严格的新极限,使得事物可以出现在标准模型以外。他们必须充分了解测量设备的灵敏度以便知道哪些情况是可以排除的。
1700952516
1700952517 为了确定结果,实验物理学家必须将代表新物理的事件从标准模型已知物理粒子的背景事件中区别出来。这是我们需要许多碰撞来探索新发现的原因之一。许多碰撞的出现,确保了有足够多事件所代表的新物理,能有别于与之相似的标准模型的常规反应。
1700952518
1700952519 故此,实验需要适当的统计。由于测量本身的一些内在不确定性,需要重复进行实验。量子力学告诉我们基本事件也有不确定性。量子力学意味着不管我们如何将技术设计得何等精良,我们也只能计算相互作用发生的概率。无论我们如何测量,不确定性依然存在,即为了准确测量相互作用的强度,唯一的方法是重复测量很多次。有时这种内在不确定性比测量技术的不确定性还小,且小到可以忽视。但是有时我们仍需要将其考虑在内。
[ 上一页 ]  [ :1.70095247e+09 ]  [ 下一页 ]