1700952436
叩响天堂之门:宇宙探索的历程
1700952437
1700952438
1700952439
1700952440
1700952441
熟知概率与统计学对科学测量的计算大有裨益,更不用说它们在当今这个复杂世界的许多疑难事宜中所起的作用。概率逻辑之优美令我想起几年前的一件事。
1700952442
1700952443
我的一个朋友问我是否打算参加第二天晚上的一个活动,而我的回答是“不知道”,这着实令他沮丧了一番。然而对我而言十分幸运的是,他是一个擅用数学的赌徒,所以他没有坚持问我要一个肯定的答案,而是让我告诉他,他的胜算有多少。令我吃惊的是,这个问题要容易回答得多。即便我告诉他的只是一个粗略估计的概率,却比直接给出“是”或“否”的答案更能反映我当时的权衡和不确定性。结果是,它反而更像一个真诚的回应。
1700952444
1700952445
从那以后,每当我的朋友和同事认为他们不能回答某个问题时,我都尽量采用概率的方法向他们解释。我发现绝大多数人(无论是不是科学家)都有着强烈,但并非不可改变的观点——他们常常觉得概率的表达方法更合适。比如,有人很可能不知道三周后的那个周四晚上他是否想去看一场棒球赛。即便他知道自己喜欢棒球而且又想不出有没有其他工作安排,然而他还是会有所顾虑——毕竟那是在周中,所以即使他不能百分之百地确定,但也有80%的可能性会去看。虽然这只是一个估计,但是在这个点上他所给出的概率更准确地反映了他的真实期望。
1700952446
1700952447
在一场关于科学以及科学如何运作的谈话中,作为编剧和导演的马克·维森特(Mark Vicente)注意到,在遇到相同的事时,与绝大多数人不同,科学家不愿做明确、不合适的评论,这令他很吃惊。科学家虽然不必做到最准确,但是他们的宗旨是清楚地表达(至少是在他们作为专家的领域内)他们知道或者不知道、理解或者不理解的东西。所以他们鲜少说“是”或者“否”,因为这种答案并不能准确地反映各种可能性。因此取而代之,他们会以概率或者其他合适的方式来表达。不过具有讽刺意味的是,这种行业的差别常常导致人们误解或者低估科学家的论断。尽管科学家旨在提高精确度,非专业人士却不必知道如何权衡他们的论断,因为非专业人士一旦有足够多支持其论点的证据,他们会不加顾虑地说出更确信的东西。科学家没有百分之百的信心不代表他们缺乏认知。简单来说,这是存在于任何测量本质中的不确定性的结果,也是我们现在要展开探索的主题。概率思维有助于澄清数据与事实,并且为更全面的决策提供可能 。在本章节,我们将思考测量能告诉我们的东西以及为什么概率表述会更准确地反映认识的程度,这些认识是在任何特定时间的对科学或其他事情的认识。
1700952448
1700952449
科学的不确定性
1700952450
1700952451
哈佛大学近来完成了一个课程评估,试图确定素质教育的核心内容。教员们考虑、讨论并打算将其纳入科学类的一个课程类别是经验推理(empirical reasoning)。这项教学提案显示了大学的宗旨应该是:教导学生如何搜集和处理经验数据,权衡证据,理解概率估计,当条件成熟时,从数据中得出推理,并在问题不能在现有证据基础上被解决时,及时作出反应。
1700952452
1700952453
这项教学要求的议案及后来的补充,其主旨非常好,但是它暗含了一个关于测量如何发挥作用的基本误解。科学家在解决问题时通常会使用概率。当然在某些特定的观点和观察上,我们可以获得确证并可以通过科学来作出合理的论断。但是人们只能偶尔依据科学或者其他方法在事实的基础上绝对正确地处理问题。虽然我们可以搜集足够多的数据来确信因果关系,甚至作出令人难以置信的精确预测,但是这种事情具有相当的概率性。正如第1章所讨论的,不确定性(不管多么小)允许有趣的潜在新现象被发现。极少有事物是百分之百确定的,在任何还没有做过测试的条件下,没有哪些理论与假设完全适用 。
1700952454
1700952455
现象只能在它们可以被测试的有效范围内,以一定的精确度呈现出来。测量往往都存在概率。许多科学测量基于一个假设:存在着我们可以通过足够清晰和准确的测量来揭示的潜在本质。我们尽量做到精确的(或者说好到足以达到我们的目标)测量以发现这些隐藏的事实。这因此存在一种情况,例如,一系列测量结果的中心区域有95%的概率包含了测量的真实值。在这种情形下,我们可以说我们有95%的把握。这样的概率告诉我们任何特定测量的可信度以及整个概率与含义的范围。如果你既不知道它伴随的不确定性也对其没有确定估计,你就不可能完全理解一个测量。
1700952456
1700952457
不确定性的一个来源是缺乏无限精确的实验装置。一个精确的测量可能要求测量仪器必须校准到小数点后的无穷多位,测量值因此就会精确到小数点后的无穷多位。实验物理学家不可能有这样的测量,他们只能校准他们的仪器到技术允许的可能精度——就像天文学家第谷·布拉赫在四个世纪以前所做的那么专业。技术的不断发展促使测量仪器精度不断提高。即便如此,测量也永远达不到无限精确。一些系统的不确定性(systematic uncertainty )[48] ,即测量仪器本身的特质,总是会存在。
1700952458
1700952459
不确定性不表示科学家对所有选项或者表述都一视同仁(尽管新闻播报时常犯此错误)。这些二选一的选项仅在很少的情况下各居50%概率。但它们意味着科学家(或者任何追求完全准确的人)会作出声明,告诉人们哪些已经被测量了,哪些是以概率的形式体现的,哪怕这概率非常高。
1700952460
1700952461
当科学家与文人墨客都极为小心谨慎时,他们将“精确”(precision)与“准确”(accuracy)区别对待。一个装置是“精确的”意味着:当你重复测量单一数量时,你所记录的数值之间相差无几。“精确度”是描述变化程度的指标。如果重复测量的结果变化不大,那么测量就是精确的。越精确的数值所跨越的范围越窄,如果你重复测量,那么平均值也越快地收敛。
1700952462
1700952463
精确度
1700952464
1700952465
当你重复测量单一数量时,你所记录的数值之间相差无几。“精确度”是描述变化程度的指标。
1700952466
1700952467
“准确度”告诉你的是:测量的平均值与准确结果接近的程度。换言之,它描述了测量装置是否有偏差。从技术上来讲,虽然测量装置的内禀误差不会降低它的精确度(因为你每次会犯同样的错误),但是它会毫无疑问地降低你的准确度。系统的不确定性反映了源于测量仪器本身的无法避免的准确度缺失。
1700952468
1700952469
准确度
1700952470
1700952471
“准确度”告诉我们的是测量的平均值与准确结果接近的程度。换言之,它描述了测量装置是否有偏差。
1700952472
1700952473
然而在许多情形下,即便你可以构造出完美测量的仪器,你仍需采取多次测量来得到正确的结果。这是因为另一个不确定性的来源[49] 是“统计性的”,也就是说测量通常需要重复很多次才能给出你所信赖的结果。所以,即便是一个准确的设备也不一定在任一特定的测量中给出一个正确的结果,但是多次测量的平均值会收敛落到正确的结果上。系统的不确定性掌控了测量的准确度,而统计的不确定性影响其精确度 。一个好的科学研究在这两个方面上都要考量,因此测量要在可行的范围内、尽量多的样品上尽可能仔细地展开。理论上说,你想让你的测量既准确又精确,以至于所期的绝对误差很小,因此你可以信赖你所发现的结果。也就是说,你想让数值落到一个尽可能窄的范围内(精确),并让它们收敛到正确的数值上面(准确)。
1700952474
1700952475
我们可以考虑一个熟悉且重要的例子:药物疗效实验。医生通常不会讲他们可能也不了解相关的统计。当你被告知“这种药有时有效、有时没效”时,你有没有感到沮丧?不少有用资讯被这种表述所抑制,使人对这种药物的有效性充满疑惑。于是,怎么做成为一件难以抉择的事情。一个相对较为有用的表述应该告诉我们:药物或者疗程以怎样的一个比例,在年龄和胖瘦程度相似的病人身上起了什么作用。这样,即便医生们自己不懂统计学,他们也可以肯定地给出一些有用的数据和信息。
1700952476
1700952477
平心而论,人的差异性加之个体对药物的不同反应,使得断定一种药品是否有效成为一个复杂的问题。所以让我们先考虑一个简单一些的情形,来检测一个单独的个体。
1700952478
1700952479
我们用测试阿司匹林是否有助于减轻头疼的过程来作为例子。解决的方法看似相当简单:吃一颗阿司匹林看是否有效。但是实际情况要稍微复杂一点。因为即便你感觉好些,你又怎能知道一定是阿司匹林起的功效呢?为了能确切知道是不是阿司匹林的效用(即,是否你服药了头疼就会减轻,或者疼痛好得比没有服药时快),你需要有吃药与不吃药的比较。然而,你要么吃药要么不吃,单单一次测试是不足以告诉你答案的。
1700952480
1700952481
奏效的方法是做很多次测试。每次一旦头疼,抛硬币来决定是否需要吃一颗阿司匹林并且记录结果。当你做了足够多测试,把各种不同类型的头疼,以及变化的环境(例如,当你没那么困倦时头疼好得更快一些)取平均,并用统计来得出正确的结论。假定你的测试没有偏差,因为你是用抛硬币来决定是否吃药,并且你所采用的人口样本就只有你自己,那么你的结果会在自己所采用的足够多的测试上正确收敛。
1700952482
1700952483
要是总能了解药物在这样简单的程序下有效与否那该有多好。但是绝大多数药物治疗的都是比头疼严重得多的疾病,而且许多药物还有长期效应,因此哪怕你想,你也不能在一个病患身上反复地进行短期试验。
1700952484
[
上一页 ]
[ :1.700952435e+09 ]
[
下一页 ]