打字猴:1.704437384e+09
1704437384
1704437385 布雷迪和帕克菲尔德预测失败的案例,似乎让人们在一段时期内不愿再付出努力对地震进行预测,但在21世纪初,预测热情又强势回归,新发明的数据导向法在地震预测中颇为流行。
1704437386
1704437387 其中一个方法是由弗拉迪米尔·克里斯–布鲁克提出的。这位出生在苏联的地球物理学者年近90岁,现任加利福尼亚大学洛杉矶分校教授。克里斯–布鲁克作了很多努力推动地震成因理论的发展。1986年克里斯–布鲁克第一次招来恶名。那是在雷克雅未克的峰会上,里根总统和米哈伊尔·戈尔巴乔夫会面时,克里斯–布鲁克递交给里根一厚摞报告,报告中预测未来5年美国将会发生一次大地震,这一事件随后被人们解读为1989年撼动旧金山的洛马·普雷塔大地震。
1704437388
1704437389 2004年,克里斯–布鲁克和他的团队宣称已经在地震预测领域取得重大突破,通过辨识某一区域小地震发生的模式,可以预测到大地震。克里斯–布鲁克识别这些模式的方法复杂繁琐,晦涩难懂,用8个方程式代表已发生的地震,在可观测到的时空间隔里,几个方程式又彼此结合应用。该团队称,用这个方法,他们成功地预测到了2003年加州圣西蒙地震和日本北海道地震。
1704437390
1704437391 这只是克里斯–布鲁克和他的团队的一家之言,圣西蒙和北海道的地震预测究竟是不是在地震前就公布的,还不得而知。查阅学术大全数据库中与报纸相关的部分会发现,2003年的报纸对这两次大地震只字未提。评价一种预测方法是否成功,关键是要把“预测过去”和“预测未来”区分开,前者可以说是一个逆喻,很显然不能算作成功预测。
1704437392
1704437393 而2004年1月,克里斯–布鲁克则毫不掩饰地向公众公布了自己的又一项预测:在接下来的9个月内,加州南部的莫哈韦沙漠地区会发生一场震级至少为6.4级的地震。这个预测得到了广泛关注,《发现》杂志、《洛杉矶时报》以及其他很多主流出版物都为克里斯–布鲁克设置了专栏。施瓦辛格州长办公室也打来了电话,还召开了一次紧急会议。甚至连一向持怀疑态度的美国地质调查局当时都欣然对克里斯–布鲁克表示出一定的赞许,在其官网上肯定克里斯–布鲁克团队的工作是采取合理的方法所进行的地震预测研究。
1704437394
1704437395 但是,莫哈韦沙漠地区那一年并没有发生大地震,甚至将近10年过去了,该地区也没有发生过一次地震。克里斯–布鲁克团队仍在从事地震预测工作,对加州、意大利和日本的地震进行预测,但鲜有准确的时候。2010年一项调查发现,该团队提前公布的地震预测中只有3次准确,其他23次皆以失败收场。
1704437396
1704437397 印度尼西亚,苏门答腊岛
1704437398
1704437399 地震预测中的另一种错误是,认为某一地区绝对不可能发生某一级别的地震,但后来却发生了。戴维·鲍曼是克里斯–布鲁克以前的学生,现为加州州立大学富勒顿分校地质学系主任。2004年苏门答腊岛发生9.2级大地震,引发的海啸致使23万人丧生,此后,戴维·鲍曼将更多的精力投入地震预测。与克里斯–布鲁克的预测方法相同,鲍曼采取的也是数据导向法,利用中等级别的地震预测高级别的地震。然而,鲍曼的方法更加简捷巧妙,更加雄心勃勃,提出了“加速力矩释放”理论,试图测定某一个断层体系中不同点所受压力的大小。另外,和克里斯–布鲁克的方法不同的是,这一系统能预测断层中任意一点发生地震的可能性,不仅能预测到哪里会发生地震,还能预测到哪里不会发生地震。
1704437400
1704437401 起初,鲍曼和他的团队确实取得了一些成功:2005年3月,一场震级为8.6级的大余震袭击苏门答腊岛,震中就在鲍曼测出的高风险区域。然而,2006年鲍曼发表的一篇论文表明,在这一个断层中的另一个区域发生地震的可能性较低,这片区域位于印度洋,邻近印度尼西亚的明古鲁省。然而就在一年后的2007年9月,一系列地震就发生在这片区域,最高震级达到8.5级。幸运的是,这些地震离近海很远,伤亡较少,但却推翻了鲍曼的理论。
1704437402
1704437403 2007年“加速力矩释放”模型失败,鲍曼并没有像其他预测者那样责怪运气不好(其实,他的模型也考虑过明古鲁市附近可能会发生地震,只是认为可能性不大),而是重新检查了自己的模型,认定用这种方法预测地震是完全错误的,于是决定弃用。
1704437404
1704437405 “我是一个失败的预测者,”2010年鲍曼告诉我说:“我做了一件大胆却愚蠢的事。我进行了一个可试验的预测,我们应该这么做,可一旦出错,就要自食其果。”
1704437406
1704437407 鲍曼一直有一个想法,通过识别地震的成因——地质断层上累积的压力——对地震做出预测。实际上,鲍曼想要了解的是,在整个断层体系中,压力是如何变化和蔓延的。他的这一观点是受混沌理论的启发得来的。
1704437408
1704437409 混沌理论是一个可以制服的恶魔,气象预报员就成功地做到了这一点,至少在一定程度上做到了这一点。气象预报员对大气的理论认识要比地震学家对地壳的了解深刻得多,他们或多或少地知道天气是如何变化的,这种认识甚至深入到分子层面,但地震学家却没有这样的优势。
1704437410
1704437411 鲍曼评论道:“对气象系统的研究来说,想要了解大气变化是一件很简单的事,只要抬头看看天就好。而我们观察的是岩石,大多数研究对象都在地下15000米的地方,我们不能期望钻个洞探下去,说实话,那只是科幻电影中才有的情节。这是一个根本性的问题,我们没有办法直接测量地壳的压力。”
1704437412
1704437413 因为缺乏这样的理论认识,地震学家只能采取纯统计方法预测地震。你可以像鲍曼一样,在自己的模型中创设一个名为“压力”的数据变量。由于无法直接对其进行测量,“压力”这一变量只能表达为过去发生的地震的一个数学函数。而鲍曼认为这样的纯统计方法根本不可能奏效,“数据集里满是噪声干扰,光有统计学意义的数据并不足以验证假说”。
1704437414
1704437415 在地震预测和部分的经济学、政治学领域中,有很多干扰数据,理论也不发达。这些领域的知识预测常会按照两步法进行:第一步,将干扰噪声误认为有用信号;第二步,噪声信息流毒于学术期刊、博客媒体、新闻报道,并发出错误的警示,破坏科学,阻碍我们理解这些系统的真实情况。
1704437416
1704437417 过度拟合模型:将噪声误认为信号
1704437418
1704437419 在统计学中,将噪声误认为信号的行为被称为过度拟合。
1704437420
1704437421 假设你是一个小偷小摸的惯犯,而我是你的老板,我要求你想出一个撬密码锁的办法,就是中学学校里常见的那种锁——也许我们打算去偷学生的午饭钱。我期待的撬锁法是,能让我们无论何时何地都可以很有把握地撬开锁。我给了你3把锁进行练习,红色的、黑色的和蓝色的。
1704437422
1704437423 用这几把锁反复试验了几天后,你回来告诉我,你发现了一个绝对正确的办法:如果锁是红色的,密码组合就是27–12–31;如果锁是黑色的,密码组合就是44–14–19;如果锁是蓝色的,密码组合就是10–3–32。
1704437424
1704437425 但我告诉你,你根本就没有完成任务。的确,你想出了开这3把锁的办法,但你并没有作更多的努力提升撬锁理论,这个理论可以指导我们撬开随意一把陌生的锁。我一直非常想知道有没有一种办法可以撬开所有的锁,或者锁本身有什么结构缺陷可被我们利用,或是有哪些破解密码的技巧,比如,某一类数字更常被用作密码,等等。但是,你却给了我一个过于具体的办法,妄图解决一般问题。这就是过度拟合,它是导致预测错误的原因。
1704437426
1704437427 拟合的说法源自统计模型和过去的观测结果相吻合的程度,当过于粗略地拟合时(我们称之为不充分拟合),这时我们会错过本可以捕捉到的信号。当拟合太过紧密时(我们称之为过度拟合),这意味着你在对数据中的噪声进行拟合,而不是挖掘数据的深层结构。在实践中,过度拟合的错误更为常见。
1704437428
1704437429 为了弄清楚这种错误的成因,我们暂且赋予自己一种在现实生活中几乎不可能拥有的优势——我们清楚地知道真实数据原本的面目。在图5–4中,我画了一条平缓的抛物线,顶点落在中间位置,末端逐渐减弱。这条抛物线用来代表你希望了解的所有现实数据。
1704437430
1704437431 然而,我们还是不能直接观察到数据的深层关系,这种关系由一系列独立的数据点体现出来,我们只能从这些点推断出这种关系模型。另外,这些数据点还会受特殊环境的影响(有信号,也有噪声)。在图5–4中,我画了100个数据点,分别用圆形和三角形标记,貌似这样就足以从噪声中捕捉到信号。尽管这些数据中存在一定的随机性,但显然它们仍遵循着这条抛物线。
1704437432
1704437433 然而,当我们的数据相对有限时(现实情况常常如此),情况将会怎样呢?那时,我们就更有可能陷入过度拟合的麻烦中。在图5–5A 中,我将100个数据点缩减至25个,这时,你会如何连接这些点呢?
[ 上一页 ]  [ :1.704437384e+09 ]  [ 下一页 ]