1704437434
1704437435
1704437436
1704437437
1704437438
图5–4 数据的真实分布情况
1704437439
1704437440
当然,如果你知道真实数据应该呈现的关系模型,就会很自然地将它们连接成一条抛物线。确实,用二次方程式这样的数学表达式可以很好地重建真实的关系模型(如图5–5B)。
1704437441
1704437442
1704437443
1704437444
1704437445
图5–5A 有限数据样本
1704437446
1704437447
然而,在无法获知数据的理想模型时,我们有时就会变得很贪婪,图5–5C 代表的就是这样一个例子,一个过度拟合的模型。在图中,我们设计了一个复杂的函数,可以追踪每一个边缘数据点,用这个函数将这些点连接起来,曲线的上下波动陡然增强。这使得我们离真实的关系模型越来越远,也会使预测更离谱。
1704437448
1704437449
1704437450
1704437451
1704437452
图5–5B 适度拟合模型
1704437453
1704437454
这个错误貌似很容易避免,如果我们无所不知,对数据的深层结构总是了如指掌的话,这个错误也确实可以轻松避免。然而,几乎在所有的现实工作中,我们都必须利用归纳法,从已知的证据中对其结构进行推断。当数据有限又充满噪声时,当我们对基本关系的理解很浅显时,就更有可能对一种模型做出过度拟合,在地震预测中,这两种情况可谓司空见惯。
1704437455
1704437456
1704437457
1704437458
1704437459
图5–5C 过度拟合模型
1704437460
1704437461
如果我们既不知道也不在乎数据关系的真相,就有很多理由可以解释我们为什么倾向于过度拟合的模型。其中一条就是,在预测者最常用的统计测试中,过度拟合模型更受青睐。有一项常用的测试是用来测量我们的模型可以解释多少数据的变化。根据这一测试,过度拟合的模型(图5–5C)解释了85%的数据变化,而适度拟合模型只解释了56%的数据变化。但是实质上,过度拟合模型是在混淆视听,将噪声误当作信号混入模型中。事实上,在解释真实世界时,它的表现更糟。
1704437462
1704437463
这种解释似乎让情况一目了然,但很多预测者完全无视这个问题。研究者拥有很多统计方法,可这么多的方法却没有让他们增加一点科学态度,减少一点幻想,而是像充满幻想的孩子在天空中寻找动物形状的云一样。数学家约翰·冯·诺伊曼谈到这个问题时曾说:“我用4个参数就能拟合出一头大象,用5个参数就可以让这头大象甩动它的鼻子。”
1704437464
1704437465
过度拟合代表了双重霉运:过度拟合的模型表面上来看比较好,但其实际性能却很糟糕。因为后一种因素,若被用在真实的预测活动中,过度拟合模型最终会让预测者付出沉重的代价。而因为前一种因素——其表面效果不错,而且自称可以做出非常准确并且新闻价值很高的预测,比其他应用技术都先进,所以,这类模型更吸引人,更容易在学术期刊上得到推介,也更容易被推销给客户,从而将其他可靠的模型排挤出市场。但是,如果这个模型是用噪声拟合的,就很有可能会阻碍科学发展。
1704437466
1704437467
你也许猜到了,克里斯–布鲁克的地震模型就是很严重的过度拟合模型。这一模型将一组超级复杂的方程式应用在噪声数据中,也因此付出了代价——预测正确率只有3/23。戴维·鲍曼意识到他的模型也有类似的问题,便果断终止使用。
1704437468
1704437469
应该说明的是,这些错误通常都是真实的。借用另外一本书的题目《随机漫步的傻瓜》[1]来说就是,这些错误常影响我们,让我们更容易被“随机性愚弄”。我们也可能会越来越迷恋这种模型的特质,甚至可能会创造出一个貌似很有说服力的理论来证明这些错误的合理性,自己却没有意识到这一点,这不仅是愚弄同事、朋友,也是在愚弄自己。迈克尔·贝雅克曾就此写了大量的文章,他对这种进退维谷的情况作了如下解释:“在科学中,我们用怀疑主义平衡好奇心。”过度拟合的例子说明是好奇心左右了我们。
1704437470
1704437471
2011年日本大地震引发的思考
1704437472
1704437473
将噪声误认为信号的倾向,有时会给现实世界带来极可怕的后果。在日本,尽管地震活动极其频繁,但2011年那次灾难性的地震还是让这个国家措手不及。福岛核反应堆是按照可抵御8.6级地震的标准设计的,无法承受震级高达9.1级的地震。考古资料表明,2011年由地震引发的约40米高的海浪在历史上曾经引发过多次海啸,但这次人们明显忘记了或者根本无视这些惨痛的案例。
1704437474
1704437475
9.1级地震在全世界都很少见,没人能确切地预测到这样的地震会发生在哪个10年里,更不用说具体的日期了。而在日本,一些科学家和中央计划员却排除了近期发生地震的可能性。这一点就反映了日本的地震预测模型是过度拟合模型。
1704437476
1704437477
在图5–6A 中,我画出了2011年日本福岛地震震中附近发生地震的历史频率。这些数据中的地震级别逐渐加大,却没有达到3月11日的9.1级。通过看图你会发现,数据几乎遵循着古登堡–里克特法则的那种直线预测模型,然而,在7.5级处出现了一个拐点,而且,该地区自从1964年发生了一场震级达8.0级的地震后,再没有发生过震级更大的地震,于是,这条线似乎开始向下弯曲了。
1704437478
1704437479
1704437480
1704437481
1704437482
图5–6A 日本东北部地区地震发生的频率图(1964年1月1日 ~2011年3月10日)
1704437483
[
上一页 ]
[ :1.704437434e+09 ]
[
下一页 ]