1700496090
算法之美:指导工作与生活的算法 机械复制时代的先验
1700496091
1700496092
路德维希·维特根斯坦
1700496093
1700496094
这就好像有人要买好几份同样的晨报来确保报纸上说的是真的。
1700496095
1700496096
安妮·迪拉德
1700496097
1700496098
他仔细看他所读的内容,因为那是他要写的东西。他很认真学习他所学的内容,因为那是他将会懂得的东西。
1700496099
1700496100
正如贝叶斯法则告诉我们的,做出准确预测的最好方法就是准确地了解你所预测的事情。这就是为什么我们能很好地预测人类的寿命,但是当被问及预测法老的统治时间时却不尽如人意。
1700496101
1700496102
作为贝叶斯法则的一种好方法,它以正确的比例表现世界——具有充分合理的先验,并适当校准。总的来说,对于人类和其他动物来说,这种情况是自然发生的。通常,当有什么东西使我们感到惊奇时,它应该让我们吃惊,而当它不应该让我们吃惊的时候,它就不会。即使我们所积累的偏见不是客观正确的,这些偏见通常还是会合理地反映我们所生活的世界的特定部分。例如,生活在沙漠气候中的人可能高估了世界上的沙量,而生活在极地的人可能高估了雪的总量。但他们都能很好地适应自己的生态环境。
1700496103
1700496104
然而,当一个物种学会使用语言时,一切就开始瓦解。我们所谈论的并不是我们所经历的事情——我们主要谈论的是有趣的事情,而这些事往往也是不寻常的。根据其定义,事件总是或多或少地在其适当的频率发生,但语言并不完全是这样。任何经历过蛇咬伤或雷击的人,都会在他们余下的生命中复述那些奇异的故事。这些故事是如此不寻常,因此会被人不断谈起。
1700496105
1700496106
之后,在与他人沟通和保持准确的先验世界之间有一种奇怪的压力。当人们谈论感兴趣的事或说一些他们认为听众也会感兴趣的故事时,就偏离了我们的经验统计。这使得经验统计很难保持适当的先验分布。而随着印刷术、新闻和社交媒体的发展,这种挑战会不断增加,并使我们人类这个物种能够机械地传播语言。
1700496107
1700496108
想想你见过多少次失事的飞机或汽车。你完全可能看过以下某个场景——失事的汽车可能就在你旁边的道路上,而飞机坠毁可能发生在另一个大陆,这些消息都是通过互联网或电视传输给你的。例如,在美国,从2000年起到现在,在商业飞机上失去生命的总人数不足以填满卡耐基音乐厅,甚至一半都没有。相比之下,美国在同一时间段死于车祸的人数就超过了怀俄明州的全部人口。
1700496109
1700496110
简单地说,媒体对事件的报道并不与其在世界上发生的频率相符。社会学家巴里·格拉斯纳指出,在20世纪90年代美国的谋杀率下降了20%,然而在那段时间里,美国新闻中所报道的枪支暴力事件却增加了600%。
1700496111
1700496112
如果你想成为一个具有准确直觉的贝叶斯主义者——如果你想自然地做出准确的预测,而不必考虑什么样的预测规则是适当的,你就需要保护你的先验。相反,这可能意味着要关闭消息来源渠道。
1700496113
1700496114
1700496115
1700496116
1700496118
算法之美:指导工作与生活的算法 07 过度拟合 不要想太多
1700496119
1700496120
当查尔斯·达尔文试图决定是否应该向他的表妹艾玛·韦奇伍德求婚时,他拿出一支铅笔和一纸张,并衡量了每一个可能的后果。关于结婚的好处,他列举了孩子、陪伴和“音乐与女性聊天的魅力”等因素。相反,关于婚姻中的不利因素,他列举了“可怕的时间损失”、没有自由去他想要去的地方、亲戚的负担、孩子带来的花费和焦虑、担心“也许我的妻子不喜欢伦敦”,以及花在买书上的钱变得更少等。衡量这一系列因素使取得胜利的渠道变得十分狭窄,最后,达尔文潦草地用拉丁文写道:“结婚——结婚——结婚,这被证明了。”达尔文自己用英文重述了这一数学结论:“这证明结婚是必要的。”
1700496121
1700496122
在达尔文所处的时代,优劣对比已经被推崇,而这在一个世纪前已被本杰明·富兰克林认可。为了克服“令我们困惑的不确定性”,富兰克林写道:
1700496123
1700496124
我的方式是在一张纸的中间画一条线,将其一分为二,一半写上优势,另一半写劣势。然后在几天的考虑之中,我用不同的方式考虑不同动机的短期提示,考虑在不同的时间该措施可能带来的利弊。当我把它们聚集在一个视图时,我努力评估它们各自的权重。我会找到两项看起来能抵消的因素,然后把它们都划掉:如果我找到一个优势因素的权重相当于两个劣势因素,我就划掉三个。如果我判断两个正面理由相当于三个负面理由,我会划掉五个。这样,我就找到了平衡所在,如果经过一两天的考虑,任何一方都不会有任何重要的新理由出现,我便可以相应地做出决定。
1700496125
1700496126
富兰克林甚至认为这是一个计算公式,并说:“我从这种方程式(所谓的道德或保守的代数)中发现了很大的优势。
1700496127
1700496128
当我们在考虑思考过程时,很容易认为想到更多自然会更好:你列出的利弊越多,越能做出更好的决定。关于股票的价格走向,你能辨别的相关因素越多,能做出的预测更准确;你花在工作上的时间越多,能写出的报告越好。这肯定是富兰克林法则存在的前提。在这个意义上,达尔文对结婚与否的“代数”分析,尽管有些古怪,但似乎也是一种非常合理甚至是值得称赞的方法。
1700496129
1700496130
然而,如果富兰克林或达尔文已经进入机器学习研究的时代,也就是教会计算机如何根据经验做出良好判断的科学,他们会看到道德代数的基础被不断动摇。想一想思考的力度和考虑的因素这些问题,就是统计人员和机器学习研究人员所称的“过度拟合”这个棘手的问题的核心。处理这个问题可以揭示出,刻意地较少思考也是一种智慧。意识到过度拟合的问题可以改变我们投资、就餐、健身,甚至祭祀的方法。
1700496131
1700496132
1700496133
1700496134
1700496136
算法之美:指导工作与生活的算法 反对复杂性案例
1700496137
1700496138
《飞燕金枪》
[
上一页 ]
[ :1.700496089e+09 ]
[
下一页 ]